Video: Hadoopin'! 2025
avaimet ja niiden yksittäiset arvoluettelot siten, että asiakassovellukseen normaalisti palautetaan avain / arvo -parin joukko. Tässä on puhuttu toistaiseksi: Suuri tietojoukko on jaettu pienempiin paloihin, joita kutsutaan syöttölohkoiksi, ja yksittäiset kartoitustehtävät ovat käsiteltäneet kukin niistä.
Joissakin tapauksissa tämä yhden käsittelyvaihe on kaikki, mitä tarvitaan tuottamaan haluttu sovelluslähtö. Jos esimerkiksi suoritat perusmuunnosoperaation tietoja - muuntamalla kaikki tekstin suuriksi, esimerkiksi poistamalla avainkehykset videotiedostoista - yksinpaino on kaikki, mitä tarvitset. (Tämä on nimeltään vain vain kartta).
Samoin kuin kartoitustoiminto, joka käsittelee jokaisen tietueen yksi kerrallaan, vähennyslaite käsittelee jokaisen avaimen erikseen. Tavallisesti pelkistin palauttaa yhden avain / arvo -parin jokaiselle avaimelle, jota se käsittelee. Nämä avain / arvo -parit voivat kuitenkin olla yhtä laajat tai pienet kuin tarvitset niitä.
Jos resurssienhallinta (tai JobTracker, jos käytät Hadoop 1: tä) yrittää parhaiten määrittää resursseja kartoituksen tehtäviin sen varmistamiseksi, että syöttöliittymät käsitellään paikallisesti, ei ole tällaista strategiaa vähennystoiminnalle. Oletetaan, että kartoituksen tehtävän tulossarjat on siirrettävä verkon yli, jotta ne voivat käsitellä vähennystoimintoja.