Koti Henkilökohtainen rahoitus Hadoop's MapReduce Application Flow - dummiesin karttaprosessi

Hadoop's MapReduce Application Flow - dummiesin karttaprosessi

Video: MapReduce Flow Chart 2025

Video: MapReduce Flow Chart 2025
Anonim

MapReduce-sovellus käsittelee syötetyt eritelmän tiedot rekisteriä perusteella ja että jokainen tietue ymmärretään MapReducen ollessa avain / arvo pari. Sen jälkeen, kun tulo-jakaumat on laskettu, kartoitustehtävät voivat alkaa käsitellä niitä - eli juuri sen jälkeen, kun resurssienhallinnan aikataulutusyksikkö määrittää niiden käsittelyresurssit. (Hadoop 1: ssä JobTracker määrittää kartoitustehtävät tiettyihin käsittelyn aikaväleihin.)

Mapper-tehtävä itse käsittelee panoksensa jakamalla yhden tietueen kerrallaan - kuvassa tämä yksinäinen tietue edustaa avain / arvo-pari. Lennon tietojen tapauksessa, kun tulo-erottelut lasketaan (tekstitiedostojen oletustulostusmenetelmällä), oletus on, että jokainen tekstitiedoston rivi on yksi tietue.

Jokaisesta tietueesta rivin teksti edustaa itse arvoa, ja kunkin rivin tavun siirto alusta alkaen katsotaan avaimeksi.

Saatat ihmetellä, miksi rivinumeroa ei käytetä tavujen offset-tilan sijaan. Kun katsot, että erittäin suuri tekstitiedosto on jaettu useisiin yksittäisiin datalohkoihin ja käsitellään niin monta erottelua, rivi numero on vaarallinen käsite.

Kunkin jakamisen rivien lukumäärä vaihtelee, joten ei ole mahdollista laskea käsittelyn edeltävien rivien lukumäärää. Byte offset -toiminnon avulla voit kuitenkin olla tarkka, koska jokaisella lohkolla on kiinteä määrä tavua.

Kun kartoitusprosessi käsittelee jokaisen tietueen, se luo uuden avain / arvo -parin: Täällä oleva avain ja arvo voivat olla täysin erilaiset kuin tulopari. Mapper-tehtävän tulos on kaikkien näiden avain / arvoparien koko kokoelma.

Ennen jokaisen kartoitustyön lopullisen tulostustiedoston kirjoitustaulukko, lähtö jaetaan avaimen perusteella ja lajitellaan. Tämä osiointi tarkoittaa, että kaikki avaimen arvot ryhmitellään yhteen.

Jos kyseessä on melko perusnäytehakemus, on vain yksi vähennysventtiili, joten kaikki kartoitustehtävän tulos kirjoitetaan yhteen tiedostoon. Mutta tapauksissa, joissa on useita pienennyksiä, jokainen kartoitustehtävä voi tuottaa useita tulostustiedostoja.

Näiden ulostustiedostojen erittely perustuu osiointiavaimeen. Jos esimerkiksi kartoitustehtäviin on tuotu vain kolme erillistä jako-avainta, ja olet määrittänyt kolme vähennystä työhön, tulee olemaan kolme kartoitustulostustiedostoa. Tässä esimerkissä, jos jokin tietty kartoitusprosessi käsittelee syötteen jakamista ja tuottaa tuotoksen kahdella kolmesta avaimesta, tulee olemaan vain kaksi tulostetiedostoa.

Pakkaa karttatiedostojen tulostustiedostot aina. Suurin hyöty tästä on suorituskyvyn parantumisessa, koska pienempien tulostustiedostojen kirjoittaminen minimoi väistämättömät kustannukset, jotka siirtävät karttatiedon solmujen kohdalle, missä vähennysventtiilit ovat käynnissä.

Oletusarvoinen osiointi on useimmissa tilanteissa enemmän kuin riittävä, mutta joskus voit halutessasi muokata, miten tiedot jaetaan osioiksi ennen kuin vähennyslasit käsittelevät sitä. Voit esimerkiksi halutessasi tuloksesi tiedot lajitella avaimen ja niiden arvojen mukaan - tunnetaan toissijaisena lajitteluna.

Tätä varten voit ohittaa oletuspartitionerin ja toteuttaa oman. Tämä prosessi vaatii kuitenkin jonkin verran huolta, koska haluat varmistaa, että kunkin osion tietueiden määrä on yhtenäinen. (Jos alennusvaihde joutuu käsittelemään paljon enemmän tietoa kuin muut -laskijat, sinun odota MapReduce työn päättymistä, kun yksittäinen ylityöllistettyjä alennusvaihde on slogging kautta suhteettoman suuren tietokokonaisuutta.)

käyttäminen tasakokoisia väli tiedostojen voi paremmin hyödyntää MapReducen käsittelyssä käytettävää rinnakkaisuutta.

Hadoop's MapReduce Application Flow - dummiesin karttaprosessi

Toimittajan valinta

Hot Flushes ja vaihdevuosiohjeet - dummies

Hot Flushes ja vaihdevuosiohjeet - dummies

Koska monet naiset alkavat vain miettimään vaihdevuodet kun he alkavat saada kuuma aallot muutamia nopeita vinkkejä tämän vaihdevuodet liittyvän oireen hoitamiseen: Harjoittelu usein: Yksi 20-vuotiasta naista kuulee usein kuumia aaltoja. Sitä vastoin yksi neljästä naisesta, joka ei käytä kokemuksia kuumia huuhteluita. Vältä alkoholia ja kofeiinia ja ...

Miten vaihdella vaihdevuodet vaihdevuodet - dummies

Miten vaihdella vaihdevuodet vaihdevuodet - dummies

Voimakas lämpöhalkaus voittaa heidät. Seuraa näitä ohjeita kuumakalvojen vähentämiseen ja niiden vaikutuksiin: Käytä säännöllisesti. Vain yksi 20: stä naisesta, jotka käyttävät säännöllisesti kuumia aaltoja. Niistä naisista, jotka eivät harjoittele, yksi neljästä kokemuksesta kuumenee. Kytke kattotuuletin tai ...

Sukupuoli Dummies Cheat Sheet - dummies

Sukupuoli Dummies Cheat Sheet - dummies

Onko sinulla itsesi Don Juan, Lady Chatterly tai seksuaalinen aloittelija , kaikki voivat saada eniten nautintoa seksistä vähän enemmän tietoa. Sinun pitäisi tietää, että esipelin on jotain, joka sinun pitäisi ottaa huomioon vuorovaikutuksessa, jonka sinulla ja kumppanillasi on, sekä miten pitää asiat ...

Toimittajan valinta

Käytä Excel-kojelausekkeesi List Box Control - dummies

Käytä Excel-kojelausekkeesi List Box Control - dummies

Excel-hallintapaneelista ja raportoi käyttäjät valitsemasta ennalta määritetyistä valinnoista. Kun luettelokohdasta valitaan jokin kohde, valitaan jokin toiminto. Voit lisätä luetteloruutuun laskentataulukkoon seuraavasti: Valitse Lisää-pudotusvalikko ...

Käytä Excelin hallintapaneelien optiopainikeohjausta - dummies

Käytä Excelin hallintapaneelien optiopainikeohjausta - dummies

-Vaihtoehtoja, joiden avulla käyttäjät voivat vaihtaa useita vaihtoehtoja Excel-hallintapaneelissa tai raportti kerrallaan. Ajatuksena on, että ryhmässä on kaksi tai useampia vaihtoehtoisia painikkeita. Valitsemalla yhden valintanäppäimen automaattisesti

Toimittajan valinta

Hanki laskentataulukkorakenne Microsoft Excelissä - dummies

Hanki laskentataulukkorakenne Microsoft Excelissä - dummies

Microsoft Excel on kyse datasta ja laskentataulukosta. Laskentataulukon jokaisella solulla on ainutlaatuinen soluosoite, joka koostuu sen sarake- ja rivinumeroista. Jokaisella solulla on oltava oma yksilöllinen osoite, jotta voit viitata siihen, kun luot kaavan. Oletetaan esimerkiksi, että haluat summata (lisää) ...

Web Clipping Internet Explorerissa - dummies

Web Clipping Internet Explorerissa - dummies

Internet Explorer on outo selain, kun kyseessä on web-leikkaus Evernote. Sinun on vain noudatettava hieman muutettuja ohjeita. Jos haluat käyttää Web Clipper -ohjelmaa Internet Explorerissa, toimi seuraavasti: Korosta teksti, jonka haluat leikata tai (jos leikkaa koko artikkeli tai näyttö), siirry vaiheeseen 2. Jos ...

Senioreille: Kuinka animoit objekteja PowerPoint-diaesineissä

Senioreille: Kuinka animoit objekteja PowerPoint-diaesineissä

Oletusarvoisesti kaikki objektit Microsoft PowerPoint -luettelossa näkyvät kerralla. Jos haluat lisätä visuaalista kiinnostusta esitykseen tai paljastaa tiedot bittiä kerrallaan, voit käyttää animaatiota PowerPointissa. Voit esimerkiksi esittää kysymyksen dian otsikossa ja antaa vastauksen ...