Поддерживать
www.wikidata.ru-ru.nina.az
Informacio nnyj po isk angl information retrieval process poiska nestrukturirovannoj dokumentalnoj informacii udovletvoryayushej informacionnye potrebnosti i nauka ob etom poiske IstoriyaTermin informacionnyj poisk byl vpervye vvedyon Kelvinom Muersom v 1948 v ego doktorskoj dissertacii opublikovan i upotreblyaetsya v literature s 1950 Snachala sistemy avtomatizirovannogo IP ili informacionno poiskovye sistemy IPS ispolzovalis lish dlya poiska nauchnoj informacii i literatury Mnogie universitety i publichnye biblioteki stali ispolzovat IPS dlya obespecheniya dostupa k knigam zhurnalam i drugim dokumentam Shirokoe rasprostranenie IPS poluchili s poyavleniem seti Internet i razvitiem Vsemirnoj pautiny U russkoyazychnyh polzovatelej naibolshej populyarnostyu polzuyutsya poiskovye sistemy Yandeks Google Informacionnyj poisk kak processPoisk informacii predstavlyaet soboj process vyyavleniya v nekotorom mnozhestve dokumentov tekstov vseh teh kotorye posvyasheny ukazannoj teme predmetu udovletvoryayut zaranee opredelyonnomu usloviyu poiska ili soderzhat neobhodimye sootvetstvuyushie informacionnoj potrebnosti fakty svedeniya dannye Process poiska vklyuchaet posledovatelnost operacij napravlennyh na sbor obrabotku i predostavlenie informacii V obshem sluchae poisk informacii sostoit iz chetyryoh etapov opredelenie utochnenie informacionnoj potrebnosti i formulirovka informacionnogo zaprosa opredelenie sovokupnosti vozmozhnyh derzhatelej informacionnyh massivov istochnikov izvlechenie informacii iz vyyavlennyh informacionnyh massivov oznakomlenie s poluchennoj informaciej i ocenka rezultatov poiska Vidy poiskaPolnotekstovyj poisk poisk po vsemu soderzhimomu dokumenta Primer polnotekstovogo poiska lyuboj internet poiskovik naprimer www yandex ru www google com Kak pravilo polnotekstovyj poisk dlya uskoreniya poiska ispolzuet predvaritelno postroennye indeksy Naibolee rasprostranyonnoj tehnologiej dlya indeksov polnotekstovogo poiska yavlyayutsya invertirovannye indeksy Poisk po metadannym eto poisk po nekim atributam dokumenta podderzhivaemym sistemoj nazvanie dokumenta data sozdaniya razmer avtor i t d Primer poiska po rekvizitam dialog poiska v fajlovoj sisteme naprimer MS Windows Poisk izobrazhenij poisk po soderzhaniyu izobrazheniya Poiskovaya sistema raspoznayot soderzhanie fotografii zagruzhena polzovatelem ili dobavlen URL izobrazheniya V rezultatah poiska polzovatel poluchaet pohozhie izobrazheniya Tak rabotayut poiskovye sistemy Polar Rose Picollator i dr Metody poiskaAdresnyj poisk Process poiska dokumentov po chisto formalnym priznakam ukazannym v zaprose Dlya osushestvleniya nuzhny sleduyushie usloviya Nalichie u dokumenta tochnogo adresa Obespechenie strogogo poryadka raspolozheniya dokumentov v zapominayushem ustrojstve ili v hranilishe sistemy Adresami dokumentov mogut vystupat adresa veb serverov i veb stranic i elementy bibliograficheskoj zapisi i adresa hraneniya dokumentov v hranilishe Semanticheskij poisk Process poiska dokumentov po ih soderzhaniyu Usloviya Perevod soderzhaniya dokumentov i zaprosov s estestvennogo yazyka na informacionno poiskovyj yazyk i sostavlenie i zaprosa Sostavlenie poiskovogo opisaniya v kotorom ukazyvaetsya dopolnitelnoe uslovie poiska Principialnaya raznica mezhdu adresnym i semanticheskim poiskami sostoit v tom chto pri adresnom poiske dokument rassmatrivaetsya kak obekt s tochki zreniya formy a pri semanticheskom poiske s tochki zreniya soderzhaniya Pri semanticheskom poiske nahoditsya mnozhestvo dokumentov bez ukazaniya adresov V etom principialnoe otlichie katalogov i kartotek Biblioteka sobranie bibliograficheskih zapisej bez ukazaniya adresov Dokumentalnyj poisk V razdele ne hvataet ssylok na istochniki sm rekomendacii po poisku Informaciya dolzhna byt proveryaema inache ona mozhet byt udalena Vy mozhete otredaktirovat statyu dobaviv ssylki na avtoritetnye istochniki v vide snosok 13 marta 2024 Process poiska v hranilishe informacionno poiskovoj sistemy pervichnyh dokumentov ili v baze dannyh vtorichnyh dokumentov sootvetstvuyushih zaprosu polzovatelya Dva vida dokumentalnogo poiska Bibliotechnyj napravlennyj na nahozhdenie pervichnyh dokumentov Bibliograficheskij napravlennyj na nahozhdenie svedenij o dokumentah predstavlennyh v vide bibliograficheskih zapisej Faktograficheskij poisk Process poiska faktov sootvetstvuyushih informacionnomu zaprosu K faktograficheskim dannym otnosyatsya svedeniya izvlechyonnye iz dokumentov kak pervichnyh tak i vtorichnyh i poluchaemye neposredstvenno iz istochnikov ih vozniknoveniya Razlichayut dva vida Dokumentalno faktograficheskij zaklyuchaetsya v poiske v dokumentah fragmentov teksta soderzhashih fakty Faktologicheskij opisanie faktov predpolagayushij sozdanie novyh faktograficheskih opisanij v processe poiska putyom logicheskoj pererabotki najdennoj faktograficheskoj informacii Informacionnyj poisk kak naukaInformacionnyj poisk bolshaya mezhdisciplinarnaya oblast nauki stoyashaya na peresechenii kognitivnoj psihologii informatiki informacionnogo dizajna lingvistiki semiotiki i bibliotechnogo dela Poisk informacii process vyyavleniya v massive informacii zapisej udovletvoryayushih zaranee opredelyonnomu usloviyu poiska ili zaprosu IP rassmatrivaet poisk informacii v dokumentah poisk samih dokumentov izvlechenie metadannyh iz dokumentov poisk teksta izobrazhenij video i zvuka v lokalnyh relyacionnyh bazah dannyh v gipertekstovyh bazah dannyh takih kak Internet i lokalnye intranet sistemy Sushestvuet nekotoraya putanica svyazannaya s ponyatiyami poiska dannyh poiska dokumentov informacionnogo poiska i tekstovogo poiska Tem ne menee kazhdoe iz etih napravlenij issledovaniya obladaet sobstvennymi metodikami prakticheskimi narabotkami i literaturoj V nastoyashee vremya IP eto burno razvivayushayasya oblast nauki populyarnost kotoroj obuslovlena eksponencialnym rostom obyomov informacii v chastnosti v seti Internet IP posvyashena obshirnaya literatura i mnozhestvo konferencij Odnoj iz naibolee izvestnyh yavlyaetsya TREC organizovannoj v 1992 Ministerstvom oborony SShA sovmestno s Institutom Standartov i Tehnologij NIST s celyu konsolidacii issledovatelskogo soobshestva i razvitiya metodik ocenki kachestva IP Zapros i obekt zaprosaGovorya o sistemah IP upotreblyayut terminy zapros i obekt zaprosa Zapros eto formalizovannyj sposob vyrazheniya informacionnyh potrebnostej polzovatelem sistemy Dlya vyrazheniya informacionnoj potrebnosti ispolzuetsya yazyk poiskovyh zaprosov sintaksis variruetsya ot sistemy k sisteme Krome specialnogo yazyka zaprosov sovremennye poiskovye sistemy pozvolyayut vvodit zapros na estestvennom yazyke Obekt zaprosa eto informacionnaya sushnost kotoraya hranitsya v baze avtomatizirovannoj sistemy poiska Nesmotrya na to chto naibolee rasprostranyonnym obektom zaprosa yavlyaetsya tekstovyj dokument ne sushestvuet nikakih principialnyh ogranichenij V chastnosti vozmozhen poisk izobrazhenij muzyki i drugoj multimedia informacii Process zaneseniya obektov poiska v IPS nazyvaetsya indeksaciej Daleko ne vsegda IPS hranit tochnuyu kopiyu obekta neredko vmesto neyo hranitsya Zadachi informacionnogo poiskaCentralnaya zadacha IP pomoch polzovatelyu udovletvorit ego informacionnuyu potrebnost Tak kak opisat informacionnye potrebnosti polzovatelya tehnicheski neprosto oni formuliruyutsya kak nekotoryj zapros predstavlyayushij soboj nabor klyuchevyh slov harakterizuyushij to chto ishet polzovatel Klassicheskaya zadacha IP s kotoroj nachalos razvitie etoj oblasti eto poisk dokumentov udovletvoryayushih zaprosu v ramkah nekotoroj staticheskoj kollekcii dokumentov No spisok zadach IP postoyanno rasshiryaetsya i teper vklyuchaet Voprosy modelirovaniya Klassifikaciya dokumentov Klasterizaciya dokumentov i polzovatelskih interfejsov Izvlechenie informacii v chastnosti annotirovaniya i dokumentov Yazyki zaprosov i dr Takzhe pered dvizhkami IP stavyatsya nekotorye zadachi po obrabotke estestvennyh yazykov chto vklyuchaet v sebya morfologicheskij analiz razreshenie leksicheskoj mnogoznachnosti i tak dalee Ocenki effektivnostiSushestvuet mnogo sposobov ocenit naskolko horosho dokumenty najdennye IPS sootvetstvuyut zaprosu K sozhaleniyu ponyatie stepeni sootvetstviya zaprosa ili drugimi slovami relevantnosti yavlyaetsya subektivnym ponyatiem a stepen sootvetstviya zavisit ot konkretnogo cheloveka ocenivayushego rezultaty vypolneniya zaprosa Tochnost precision Na etom risunke relevantnye tochki rel nahodyatsya sleva ot pryamoj a tochki najdennye poiskovoj sistemoj retr nahodyatsya v ovale Oblasti krasnogo cveta predstavlyayut oshibki poiskovoj sistemy Krasnaya oblast sleva eto relevantnye tochki ne najdennye sistemoj propusk sobytiya krasnaya oblast sprava najdennye no nerelevantnye tochki lozhnaya trevoga Tochnost eto proporciya levoj zelyonoj oblasti po otnosheniyu k ovalu gorizontalnaya strelka Polnota eto proporciya levoj zelyonoj oblasti k oblasti sleva ot pryamoj diagonalnaya strelka Opredelyaetsya kak otnoshenie chisla relevantnyh dokumentov najdennyh IPS k obshemu chislu najdennyh dokumentov Precision Drel Dretr Dretr displaystyle mbox Precision frac D rel cap D retr D retr gde Drel displaystyle D rel eto mnozhestvo relevantnyh dokumentov v baze a Dretr displaystyle D retr mnozhestvo dokumentov najdennyh sistemoj Polnota recall Otnoshenie chisla najdennyh relevantnyh dokumentov k obshemu chislu relevantnyh dokumentov v baze Recall Drel Dretr Drel displaystyle mbox Recall frac D rel cap D retr D rel gde Drel displaystyle D rel eto mnozhestvo relevantnyh dokumentov v baze a Dretr displaystyle D retr mnozhestvo dokumentov najdennyh sistemoj Vypadenie fall out Vypadenie harakterizuet veroyatnost nahozhdeniya nerelevantnogo resursa i opredelyaetsya kak otnoshenie chisla najdennyh nerelevantnyh dokumentov k obshemu chislu nerelevantnyh dokumentov v baze Fall out Dnrel Dretr Dnrel displaystyle mbox Fall out frac D nrel cap D retr D nrel gde Dnrel displaystyle D nrel eto mnozhestvo nerelevantnyh dokumentov v baze a Dretr displaystyle D retr mnozhestvo dokumentov najdennyh sistemoj F mera F measure mera Van Rizbergena Inogda byvaet polezno obedinit tochnost i polnotu v odnoj usrednyonnoj velichine Dlya etoj celi srednee arifmeticheskoe ne podhodit tak kak naprimer poiskovoj sisteme dostatochno vernut voobshe vse dokumenty chtoby obespechit ravnuyu edinice polnotu pri blizkoj k nulyu tochnosti i srednee arifmeticheskoe tochnosti i polnoty budet ne menshe 1 2 Srednee garmonicheskoe ne obladaet etim nedostatkom poskolku pri bolshom otlichii usrednyaemyh znachenij priblizhaetsya k minimalnomu iz nih Poetomu horoshej meroj dlya sovmestnoj ocenki tochnosti i polnoty yavlyaetsya F mera kotoraya opredelyaetsya kak vzveshennoe garmonicheskoe srednee tochnosti P i polnoty R F 1a1P 1 a 1R a 0 1 displaystyle F frac 1 alpha frac 1 P 1 alpha frac 1 R qquad alpha in 0 1 Obychno F meru zapisyvayut v vide F b2 1 PRb2P R b2 1 a a b2 0 displaystyle F frac beta 2 1 PR beta 2 P R qquad beta 2 frac 1 alpha alpha quad beta 2 in 0 infty Pri a 1 2 displaystyle alpha 1 2 libo b 1 displaystyle beta 1 F mera pridayot odinakovyj ves tochnosti i polnote i nazyvaetsya sbalansirovannoj ili F1 displaystyle F 1 meroj v nizhnem indekse prinyato ukazyvat velichinu b displaystyle beta vyrazhenie dlya neyo uproshaetsya F1 2PRP R displaystyle F 1 frac 2PR P R Ispolzovanie sbalansirovannoj F mery ne yavlyaetsya obyazatelnym pri 0 lt b lt 1 displaystyle 0 lt beta lt 1 predpochtenie otdayotsya tochnosti a pri b gt 1 displaystyle beta gt 1 bolshij ves priobretaet polnota Sm takzheElektronnye biblioteki Polnotekstovyj poisk Poiskovye sistemy Rossijskij seminar po ocenke metodov informacionnogo poiska ROMIP PrimechaniyaManning et al 2011 pp 23 Perehody ANALYZETHIS RU neopr Data obrasheniya 12 oktyabrya 2013 14 oktyabrya 2013 goda LiteraturaBaeza Yates R Ribeiro Neto B Modern Information Retrieval Addison Wesley 1999 ISBN 0 201 39829 X Manning C Raghavan P Schutze H Introduction to Information Retrieval Cambridge University Press 2008 ISBN 0 521 86571 9 Perevod Manning K Raghavan P Shyutce H Vvedenie v informacionnyj poisk Vilyams 2011 ISBN 978 5 8459 1623 5 Lande D V Snarskij A A Bezsudnov I V Internetika Navigaciya v slozhnyh setyah modeli i algoritmy M Librokom Editorial URSS 2009 264 s ISBN 978 5 397 00497 8 Ssylkiru ir soobshestvo Informacionnyj poisk v Zhivom Zhurnale Yurij Lifshic Kurs lekcij Algoritmy dlya Interneta Kuralenok I E Nekrestyanov I S
Вершина