Video: Pig Tutorial | Apache Pig Script | Hadoop Pig Tutorial | Edureka 2024
Hadoop on rikas ja nopeasti kehittyvä ekosysteemi, jossa on yhä enemmän uusia sovelluksia. Sen sijaan, että yritettäisiin noudattaa kaikkia uusia ominaisuuksia koskevia vaatimuksia, sika on suunniteltu laajentamaan käyttäjän määrittelemien toimintojen avulla, joka tunnetaan myös nimellä UDF.
UDF: itä voidaan kirjoittaa useilla ohjelmointikielillä, kuten Java, Python ja JavaScript. Kehittäjät julkaisevat ja jakavat yhä kasvavaa UDF-kokoelmaa verkossa. (Etsi Piggy Pankki ja DataFu, nimeä vain kaksi esimerkkiä tällaisista online-kokoelmista.) Osa näistä arkistosta osaavista Pig UDF: stä ovat LOAD / STORE -funktioita (esimerkiksi XML), päivämäärän funktioita, tekstiä, matematiikkaa, ja tilastotiedostoja.
Sika voidaan myös upottaa isäntäkoneille, kuten Java, Python ja JavaScript, jonka avulla voit integroida Sika nykyisiin sovelluksiin. Se auttaa myös voittamaan Sika-kielen rajoitukset. Yksi yleisimmin viitatuista rajoituksista on se, että sika ei tue ohjausvirtauslausuntoja: jos / muu, silmukan, silmukan ja tilan lausuntojen kohdalla.
Sika tukee luonnollisesti tietovirtaa, mutta se on upotettava toiselle kielelle ohjaamaan virtausta. On kuitenkin olemassa kompromisseja, jotka kuitenkin asettavat Pigin hallinnan virtauskieliin. Esimerkiksi jos Pig-käsky on sulautettu silmukkaan, joka kerta, kun silmukka iteraa ja suorittaa Sika-lausekkeen, tämä aiheuttaa erillisen MapReduce-työn suorittamisen.