Парсінга атрымаў добрую практыку, стаў складнікам элементам пошуку, назапасіў вопыт бяспечнага выкарыстання рэгулярных выразаў і стаў прычынай новых ідэй. Проста аналізаваць кантэнт сайтаў ўжо не так актуальна, як раней. Напрыклад, ад пошукавай выдачы карыстальнік чакае большага, чым проста пераліку сайтаў, дзе сустракаецца жаданае ключавое слова.
Пошукавыя машыны ўжо навучыліся не толькі спрагаць ключавыя словы, але і здабылі ўяўленні аб кантэксце ў натуральным сэнсе, а не ў сэнсе зместу вэб-старонкі. Якасць пошукавай выдачы набыло рэальную практычную каштоўнасць.
Рэгулярныя выразы – гэта дзіўныя і нязвыклыя формы запісу таго, што патрабуецца знайсці і разабраць па палічках. Памылка ў рэгулярным выразе абыходзіцца вельмі дорага. Але рэгуляркі хутка заваявалі давер распрацоўшчыкаў, якія навучыліся карыстацца імі бяспечна і практычна. Пры гэтым пазіцыі звычайных радковых аперацый ніколькі не пахіснуліся.
Парсінга стаў звыклым і запатрабаваным. Парсер сайтаў – гэта любы збор і аналіз інфармацыі. Гэта можа быць іншы прадукт або алгарытм, напісаны ўласнымі сіламі, для канкрэтнай вобласці прымянення. Гэта запатрабаванае рашэнне для аналізу цэн на аналагічныя тавары ў канкурэнтаў. Гэта збор інфармацыі па новым праграмным прадуктам. Гэта аналіз дынамікі курсаў біржы і многія іншыя задачы.
Парсер сайтаў – гэта імкненне адлюстроўваць на сваім вэб-рэсурсе тое, да чаго прывык наведвальнік. Аналіз і пошук ключавых момантаў, якія робяць канкурэнтаў паспяховымі, і прымяненне гэтай інфармацыі для дасягнення сваіх мэтаў.
Інфармацыя, як лавіна – расце ў аб'ёме па ходзе руху, а ў кантэксце змяняецца бесперапынна. Але застаецца даступнай і тая інфармацыя, якая ўжо састарэла. Інтэрнэт набыў памяць, то ёсць пошукавыя выдачы памятаюць мінулае ані не горш, чым знаходзяць цяперашні.
Рэсурсы інтэрнэту старэюць, але не знікаюць. Агульная інфармацыйная карціна складваецца, як скальныя пароды, пластамі. Пры гэтым няма ніякай гарантыі, што ў пэўнай кропцы інтэрнэту дзясятак новых рэсурсаў сумніўнага ўтрымання закрыў сабой сапраўды састарэлы кантэнт.
Гісторыя ІТ-тэхналогій ведае мноства падзей, якія былі неапраўдана забытыя, і для адраджэння цікавасці да іх спатрэбілася час. Сёння парсер – гэта не проста разбор палётаў, гэта і ацэнка сітуацыі, і вызначэнне кропак актуальнасці ў агульным патоку інфармацыі.
Аб'ём цікавасці наведвальнікаў да той ці іншай тэме – выдатная ідэя для разбору інтарэсаў. Абагульняючы дынаміку руху наведвальніка па ўласным рэсурсу або прапаноўваючы наведвальніку пытанне, прапанова, спасылку або іншы варыянт прыцягнення ўвагі для вызначэння верагоднай рэакцыі, распрацоўшчык пераходзіць на іншы ўзровень працы. Парсер – гэта ўжо не разбор кантэнту, а даследаванне свежай рэакцыі на канкрэтныя ініцыятывы.
Калі раней парсінга проста шерстил аб'ёмы інфармацыі, то сёння ён прапануе пытанні і даследуе адказы на іх.
ААП, аблокі, штучны інтэлект, абарона ад DDoS-нападаў, але дзе гарантыя, што менавіта гэта актуальна і запатрабавана. Усё пералічанае і многае іншае і так вядома, у той ці іншай меры выкарыстоўваецца, і парсінга па такіх фразах не адкрые нічога новага.
Але ААП у прыватнасці гэта не проста JavaScript або PHP. І ў тым, і ў іншым мове ёсць сур'ёзныя адрозненні, якія істотныя, выдатна дапаўняюць адзін аднаго і не супярэчаць ў выкарыстанні. PHP-парсер можа перадаваць дадзеныя ў JavaScript браўзэра і атрымліваць назад рэакцыю наведвальніка.
Наведвальнік – гэта чалавек, і гэты чалавек нясе ў сабе фактар актуальнасці, яго дзеянні ў любым выпадку выказваюць яго зацікаўленасць у вырашэнні канкрэтнай праблемы, пошуку інфармацыі па канкрэтнай задачы.
Сучасны парсер – гэта не рэгулярны выраз, гэта – спосаб выкарыстоўваць наведвальніка (чалавека) для дасягнення канкрэтнай мэты. Хай шукае чалавек, а не машына. Навошта марнаваць сілы і прыдумляць мудренные механізмы разбору, калі натуральны інтэлект сам па сабе хоча дапамагчы следству і дазнанні.
Вызначэнне пункту актуальнасці ў чалавека атрымаецца значна лепш, чым у любога самага хуткага, але штучна-разумнага кампутара. Да рэальна разумных машын прагрэс яшчэ не дайшоў, дык чаму б не выкарыстоўваць натуральныя магчымасці чалавека?
Медыумы ў жыцці і праграмаванні сустракаюцца па гэты дзень: містыка вечная і запатрабаваная. Oracle рэальна існуе: прайшоўшыцяжкі і значны шлях, Oracle стварыў плеяду выдатных праграмных прадуктаў, выканаў вялікі аб'ём якаснай працы. Гэта выдатна, але ў пачатку вылічальнай эры ідэі, да якіх прыйшоў Oracle сёння, ужо былі, але іх незаслужана забыліся.
Сёння таксама ёсць ідэі. І на гэты раз аўтарытэт лідэра можа іх таксама зачыніць.
Сёння парсер – гэта аб'ектыўны інструмент аналізу сітуацыі, і не варта апеляваць да чыста праграмнага рашэння. Распрацоўшчык павінен праявіць інтуіцыю перш, чым пакладзе ў аснову алгарытму пошук патрэбнага рашэння.
Разбіраць гіпертэксту або натуральны тэкст сёння можа нават школьнік, нават не напісаўшы ні адной радкі кода. Але гэта будзе статычны варыянт разбору. Гэта будуць алгарытмы учорашняга дня.
Сёння парсер – гэта ідэя даследаванні ідэй, а не статычнага інфармацыйнага баласта. Інфармацыі заўсёды акіян, але мэта карабля - даставіць груз і пасажыраў, а не плаваць па хвалях прагрэсу і інфармацыйных з'яў.
У вольны ад асноўнай працы час можна збудаваць парсер "ВКонтакте" і знаходзіць задавальненне ад пошуку якіх-небудзь рашэнняў. Але там не тое грамадства, яно не дапаможа знайсці рашэнне, як стварыць ўскоснае спадчыну ў рэалізацыі ААП на мове PHP і вызначыць канцэпцыю існавання сістэм аб'ектаў на серверы ў моманты адсутнасці наведвальніка, ініцыяваць яе стварэнне.
А гэта, між іншым, вельмі актуальна, хоць і далёка не ўсім зразумела.
Інтэлект у сваім развіцці заўсёды праходзіць тры стадыі і тармозіць на чацвёртай. Першыя тры:
Чацвёртая стадыя натуральнага інтэлекту – уменне прымяняць актыўныя веды на новых тэрыторыях. Там, дзе не ступала нага чалавека і прагрэсу. Гэта цяжка, але магчыма. Тэорыя рашэння вынаходніцкіх задач больш за трыццаць гадоў таму, паказала рэальнасць і практычнасць трансфармацыі ведаў з адной вобласці ў іншую.
Гэта было тады рэальна значная падзея і, верагодна, гэта добрая нагода сёння ўспомніць пра гэта.
Article in other languages:
AR: https://tostpost.com/ar/computers/17228-the-parser-is-the-answer-for-right-question.html
DE: https://tostpost.com/de/computer/32868-parser-ist-die-antwort-auf-eine-richtige-frage.html
En: https://tostpost.com/computers/28144-the-parser-is-the-answer-for-right-question.html
HI: https://tostpost.com/hi/computers/18844-the-parser-is-the-answer-for-right-question.html
JA: https://tostpost.com/ja/computers/16889-the-parser-is-the-answer-for-right-question.html
KK: https://tostpost.com/kk/komp-yuterler/33511-parser---b-l-d-rys-oyyl-an-s-ra.html
PL: https://tostpost.com/pl/komputery/34566-parser---to-odpowied-na-poprawnie-zadane-pytanie.html
TR: https://tostpost.com/tr/bilgisayarlar/29947-ayr-t-r-c-cevab-do-ru-soru.html
ZH: https://tostpost.com/zh/computers/3147-the-parser-is-the-answer-for-right-question.html
Alin Trodden - аўтар артыкула, рэдактар
"Прывітанне, Я Алін Тродден. Я пішу тэксты, чытаю кнігі і шукаю ўражанні. І я нядрэнна ўмею распавядаць вам пра гэта. Я заўсёды рады ўдзельнічаць у цікавых праектах."
Навіны
"Mount & Blade: Гісторыя Героя" - моды. "Mount & Blade: Гісторыя Героя": чыты, коды
Шматлікія геймеры лічаць, што сюжэт - гэта адна з найважнейшых складнікаў любой кампутарнай гульні. Без моцнай сюжэтнай лініі немагчыма ўявіць сабе якасную гульню. Але гэта зусім не так, і адзін прыклад "Minecraft" можа ў пух і пр...
Everest: што гэта за праграма і для чаго яна патрэбна?
Спецыяльна распрацаваныя для камп'ютэрных сістэм інфарматыўныя ўтыліты з іх вельмі вялікімі і нават некалькі незвычайнымі магчымасцямі сёння вельмі папулярныя сярод карыстальнікаў ўсіх узроўняў падрыхтоўкі. Напэўна ўсе чулі аб так...
Парады аб тым, як карыстацца электроннай кнігай
Правільная эксплуатацыя абсталявання - залог яго даўгавечнасці. Таму эфектыўнасць і аператыўнасць функцыянавання тэхнікі шмат у чым залежыць ад карыстальніка. Сёння мы разбярэмся, як карыстацца электроннай кнігай.Выгаднае рашэннеА...
Бесправадная мышка - якія выкарыстоўваюцца тэхналогіі і іх асаблівасці
Даўно і трывала ўвайшлі ў наша жыццё новыя тэхналогіі. Тое, што раней здавалася цудам, сёння – штодзённасць. Тэхналогіі не стаяць на месцы, тэхнічныя прылады актыўна эвалюцыянуюць. Такое звыклае і простае, здавалася б, прыла...
Вучымся таму, як лавіць рыбу ў "Minecraft"
У гульні Minecraft здабычы пражытка заўсёды надаецца значнае час, т. к. без ежы ні пабудаваць замак, ні ў далёкі паход схадзіць. Вырошчванне пшаніцы ці бульбы моцна прывязвае гульца да палях, а паляванне залежыць ад поспеху. Для т...
Сістэмныя патрабаванні Metro Redux - падрабязнасці і параўнанне
У сучаснай гульнявой індустрыі з'явілася мода на тое, каб распрацоўваць не новыя часткі гульні, а перавыдаваць старыя. Спачатку такі ўсплёск репринтов не выклікаў падазрэнняў. Але цяпер мы выразна бачым, што распрацоўшчыкі наўмысн...
Заўвага (0)
Гэтая артыкул не мае каментароў, будзьце першым!