„Chrome“ skreperio prailginimo „Semalt“ vadovas

Norint, kad bet kuris verslas išliktų ir galų gale augtų, būtina išlikti pranašesniems už konkurentus ir įvairią riziką. Sprendimų priėmimas remiantis analitiniais duomenimis yra tikras būdas pamiršti šias problemas. Tokius duomenis galima gauti atliekant duomenų iškėlimą į metalo laužą. Štai kur yra paprastas „Chrome“ grandiklio plėtinys : jis ne tik palengvins duomenų rinkimo procesą, bet ir leis įbrėžti keliaujant be sudėtingų konfigūracijų.

Kaip naudotis grandikliu

    1. Pirmas dalykas, kurį jums reikia padaryti, yra įdiegti plėtinį, todėl eikite į „chrome“ internetinę parduotuvę, suraskite „grandiklį“ ir spustelėkite „Pridėti į„ Chrome “.

    2. Eikite į svetainę, iš kurios ketinate krauti duomenis , pažymėkite jus dominantį įrašą, paryškindami jį. Dešiniuoju pelės mygtuku spustelėkite jį ir pasirodžiusiame meniu pasirinkite „subraižyti panašų“.

    3. Tai padarius, atsidarys atskiras grandiklio konsolės langas. Čia pamatysite susuktų duomenų sąrašą .

    4. Norėdami išsaugoti turinį, spustelėkite „išsaugoti„ Google “dokumentuose“ - tai automatiškai eksportuos duomenis į „Google“ skaičiuoklę.

Išplėstas grandymas

Jei planuojate surinkti daugiau duomenų, galite naudoti išplėstinį požiūrį. Atminkite, kad dirbti su įrankiu bus daug lengviau, jei turite šiek tiek žinių apie HTML. Tarkime, kad norėjote nuskaityti duomenis iš šaltinio, kuriame yra archyvas, pagrįstas laiko eilučių duomenimis. Tokiu atveju, jei išbandysite aukščiau aprašytą metodą, gausite sugadintus duomenis.

Norėdami išspręsti šią problemą, galite naudoti HTML ir XML užklausų kalbą, vadinamą XPath. Ką tai daro? „XPath“ atpažįsta duomenis apie skirtingus kiekvienos atrankos elementus. Toliau pateiktas vadovas, kaip tai įgyvendinti:

1. Eikite į „Scraper“ pultą, viršutiniame kairiajame kampe turėtumėte pastebėti mygtuką „XPath“, spustelėkite jį ir surinkite pradinę lentelę.

2. Reikia parašyti „XPath“, kad būtų tinkamas elementas. Dabartinis „XPath“, apimantis visą informaciją, bus rodomas tokiu formatu: „// div [3] / div [3] / div [2] / div“. <div> elementus HTML dokumente atpažins kompiuteris.

3. Norėdami atskirti atpažintus duomenis, turite naudoti „Scraper“ stulpelius. Norėdami tai padaryti, turite ieškoti įvairių turimos informacijos rūšių. Priklausomai nuo jūsų surinktų duomenų, galite turėti pavadinimus. Šie pavadinimai yra šalia kiekvieno duomenų rinkinio. Prie jų pridedama žyma, šiuo atveju - <b> žyma.

4. Naudodamiesi apžiūros elementu suraskite ir pridėkite žymą <b> prie savo „XPath“. Dabar šį pirmąjį stulpelį galite pažymėti kaip „pavadinimo stulpelį“, nes jame bus pateikiami pavadinimai. Toliau sukurkite skirtingus XPath kiekvieno stulpelio, kurio jums reikia.

5. Spustelėkite įbrėžimą, o plėtinys automatiškai surenka duomenis ir suskirsto juos į įvairius jūsų nustatytus stulpelius.