Išplėstinė paieška ir užklausų kalba. Paieškos variklio kalba

Kompiuteriai

Užklausos kalba yra dirbtinai sukurta programavimo kalba, naudojama užklausoms duomenų bazėse ir informacinėse sistemose.

užklausos kalba

Paprastai tokie užklausų metodai gali būtipriklausomai nuo to, ar jie tarnauja duomenų bazei ar informacijos paieškai. Skirtumas tas, kad prašymai suteikti tokias paslaugas yra pateikiami siekiant gauti faktinius atsakymus į pateiktus klausimus, o paieškos priemonė bando rasti dokumentus, kuriuose yra informacijos, susijusios su naudotojui svarbiu regionu.

Duomenų bazės

Duomenų bazių užklausų kalbose pateikiami tokie pavyzdžiai:

  • QL - Objektinis, reiškia reliacines duomenų bazes; Datalog įpėdinis.
  • Kontekstinis (CQL) yra oficiali informacijos paieškos sistemų (pvz., Interneto indeksų ar bibliografinių katalogų) užklausų kalba.
  • CQLF (CODYASYL) - CODASYL-TYPE duomenų bazėms.
  • Koncepcija orientuota užklausų kalba (COQL) -naudojami atitinkamuose modeliuose (com). Jis pagrįstas duomenų modeliavimo principais ir naudojamas tokioms operacijoms kaip daugialypės analizės projektavimas ir deprojekcija, analitinės operacijos ir išvados.
  • DMX - naudojamas kasybos modeliams.
  • Datalog yra atskaitos duomenų bazių užklausos kalba.
  • Gellish anglų yra kalba, kuri galinaudojamas užklausoms Gellish anglų duomenų bazėse ir leidžia dialogui (užklausoms ir atsakymams), taip pat skirtas informacijos žinių modeliavimui.
  • HTSQL - verčia http prašymus SQL.
  • ISBL - naudojamas PRTV (viena iš pirmųjų reliacinės duomenų bazių valdymo sistemos).
  • LDAP yra užklausų ir katalogų paslaugų, veikiančių per TCP / IP, protokolas.
  • MDX - reikalinga OLAP duomenų bazėms.

Yandex užklausos kalba

Paieškos sistemos

Paieškos užklausų kalba, savo ruožtu,siekia rasti duomenis paieškos sistemose. Tai skiriasi tuo, kad dažniausiai užklausose yra paprasto teksto ar hiperteksto su papildoma sintaksė (pvz., "Ir" / "arba"). Tai labai skiriasi nuo standartinių panašių kalbų, kurios yra reguliuojamos griežta komandų sintaksė arba kuriose yra pozicijos parametrai.

Kaip klasifikuoti paieškos užklausas?

Yra trys plačios kategorijosApima daugumą paieškos užklausų: informacijos, navigacijos ir sandorių. Nors ši klasifikacija teoriškai nebuvo fiksuota, ji buvo empiriškai patvirtinta esant realioms paieškos sistemose pateiktoms problemoms.

Informacijos užklausos yra tokiosapimti įvairias temas (pvz., konkretų miestų ar sunkvežimių modelį), dėl kurių galima gauti tūkstančius atitinkamų rezultatų.

Navigacija yra paieška, kuria ieškoma konkrečios temos svetainė arba tinklalapis (pvz., "YouTube").

paieškos kalba

Transaktyvus - atspindi vartotojo ketinimą atlikti tam tikrą veiksmą, pavyzdžiui, įsigyti automobilį arba užsisakyti bilietą.

Paieškos sistemos dažnai palaiko ketvirtąprašymo tipas, kuris naudojamas daug rečiau. Tai yra vadinamieji prisijungimo užklausos, kuriose yra ataskaita apie indeksuoto žiniatinklio grafiko ryšį (nuorodų į konkretų URL ar kiek puslapių yra indeksuojami iš konkretaus domeno).

Kaip ieškoti informacijos?

Dauguma paieškos sistemų neatskleidžia jųpaieškos žurnalus, taigi labai sunku rasti informacijos apie tai, ko ieško, žiniatinklyje. Vis dėlto pirmieji moksliniai tyrimai pasirodė 1998 metais. Vėliau 2001 m. Atliktas antrasis tyrimas, kuriame analizuojamos labai aktualias užduotys. Taip pat paaiškėjo, kaip paieškos kalbos naudojamos paieškos sistemos.

Įdomios funkcijos, susijusios su žiniatinklio paieška, tapo žinomos:

Vidutinis paieškos užklausos ilgis buvo 2,4 žodžiai.

  • Maždaug pusė naudotojų atsiuntė vieną prašymą, o šiek tiek mažiau nei trečdalis naudotojų padarė tris ar daugiau unikalių užklausų po vieną.
  • Beveik pusė vartotojų žiūrėjo tik vieną arba du rezultatų puslapius.
  • Mažiau nei 5% vartotojų naudoja išplėstines paieškos galimybes (pavyzdžiui, pasirinkdami bet kurias konkrečias kategorijas arba ieškodami paieškoje).

Tinkintos veiksmo funkcijos

Tyrimas taip pat parodė, kad 19% prašymųbuvo geografinis terminas (pavyzdžiui, pavadinimai, pašto kodai, geografinės savybės ir kt.). Taip pat verta paminėti, kad greta trumpų užklausų (ty su keliomis sąlygomis) dažnai buvo numatyti modeliai, pagal kuriuos vartotojai pakeitė paieškos frazes.

loginė užklausos kalba

Taip pat nustatyta, kad 33% prašymų išvienas vartotojas pakartojamas, o 87% atvejų vartotojas spustelėja tą patį rezultatą. Tai rodo, kad daugelis vartotojų naudoja pakartotinius prašymus peržiūrėti arba susigrąžinti informaciją.

Klausimų dažnio pasiskirstymas

Be to, tai patvirtino ekspertaiprašymų dažnių pasiskirstymas atitinka galios įstatymą. Tai reiškia, kad maža dalis raktinių žodžių yra didžiausiame prašymų sąraše (pvz., Daugiau nei 100 milijonų), ir jie dažniausiai naudojami. Likusios frazės pagal tas pačias temas naudojamos rečiau ir labiau individualiai. Šis reiškinys vadinamas Pareto principu (arba "80-20 taisyklė") ir leido paieškos sistemoms naudoti tokius optimizavimo būdus kaip duomenų bazės indeksavimas arba suskaidymas, spartinimas ir išankstinis pasirinkimas, taip pat leido pagerinti paieškos užklausų kalbą.

Pastaraisiais metais buvo nustatyta, kad vidutinis ilgisužklausos nuolat didėja. Taigi vidutinė užklausa anglų kalba tampa ilgesnė. Šiuo atžvilgiu "Google" pristatė atnaujintą pavadinimą "Hummingbird" (2013 m. Rugpjūčio mėn.), Kuris sugeba apdoroti ilgas paieškos frazes su neprotokoluotos "kalbos" užklausų kalba (pvz., "Kur yra artimiausia kavinė?").

prašymas anglų kalba

Ilgesniems prašymams naudojamas jų apdorojimas - jie suskirstomi į frazes, suformuluotas standartine kalba, o atsakymai į skirtingas dalis pateikiami atskirai.

Struktūrinės užklausos

Paieškos sistemos, kurios palaiko loginįoperacijose ir sintaksėje naudokite daugiau išplėstinių užklausų kalbų. Vartotojas, kuris ieško dokumentų, apimančių kelias temas ar veidus, gali apibūdinti kiekvieną iš jų pagal loginę loginio požymio charakteristiką. Loginis užklausų kalba yra tam tikrų frazių ir skyrybos ženklų rinkinys.

Kas yra išplėstinė paieška?

Užklausos kalba "Yandex" ir "Google" galiatlikdami tikslesnę paiešką tam tikromis sąlygomis. Išplėstinė paieška gali ieškoti pagal dalį pavadinimo puslapio arba prefikso pavadinime, taip pat tam tikrose kategorijose ir vardų sąrašuose. Jis taip pat gali apriboti puslapių, kuriuose yra tam tikrų žodžių pavadinime ar tam tikrose dalykų grupėse, paiešką. Naudodamas tinkamą užklausų kalbos kalbą, jis gali apdoroti parametrus kiekybiškai sudėtingesniu nei paviršiaus rezultatai, išduodantys daugumą paieškos sistemų, įskaitant vartotojo apibrėžtus žodžius su kintamojo pabaigos ir panašiomis rašyba. Pateikę išplėstinės paieškos rezultatus, bus rodoma nuoroda į atitinkamus puslapio skyrius.

paieškos užklausos kalba

Tai taip pat yra galimybė ieškoti visais puslapiais,kuriame yra konkreti frazė, o naudojant standartinę užklausą, paieškos varikliai negali sustabdyti jokio diskusijų puslapio. Daugeliu atvejų užklausų kalba gali sukelti bet kurį puslapį, esantį žymėse noindex.

Kai kuriais atvejais gerai užpildyta užklausa leidžia jums rasti informaciją, kurioje yra keletas specialių simbolių ir raidžių iš kitų abėcėlių (pvz., Kinų simboliai).

Kaip yra užklausos kalbos simboliai?

Viršutinis ir mažasis, taip pat kai kuriediakritiniai ženklai (umlaudai ir akcentai) nėra skaičiuojami paieškose. Pvz., Paieška pagal raktinį žodį Citroen neradys puslapių su žodžiu "Citroen". Bet kai kurie ligatyrai atitinka atskirus raides. Pvz., Žodžio "aeroskobingo" paieška lengvai suras puslapius, kuriuose yra "Ereskebing" (AE = Æ).

Daugelis ne raidžių ir skaitmenų simbolių yra nuolatignoruojamas. Pavyzdžiui, neįmanoma rasti informacijos apie užklausą, kurioje yra eilutė | L | (raidė tarp dviejų vertikalių juostų), nepaisant to, kad šis simbolis naudojamas kai kuriuose konversijos šablonuose. Rezultatuose bus tik "LT" duomenys. Kai kurie simboliai ir frazės yra apdorojami skirtingai: užklausoje "kreditas (finansai)" pateikiami straipsniai su žodžiais "kreditas" ir "finansai", ignoruojami skliaustuose, net jei yra straipsnis su tiksliu pavadinimu "kreditas (finansai)".

duomenų bazės užklausų kalbos

Yra daug funkcijų, kurios gali būti naudojamos su užklausų kalba.

Sintaksė

Užklausos kalba "Yandex" ir "Google" galinaudokitės kai kuriais skyrybos ženklais, kad patikslintumėte savo paiešką. Pavyzdys yra bracės - {{search}}. Jų frazė bus ieškoma visiškai, nepakeista.

Dvigubo kabučių frazė leidžia jums nuspręstipaieškos objektas. Pavyzdžiui, žodis kabutėse bus pripažintas kaip naudojamas figurais ar išgalviu pobūdžiu be kabučių - kaip daugiau dokumentais pagrįstos informacijos.

Be to, visi pagrindiniai paieškos varikliai palaiko "-" simbolį loginiam "ne", taip pat ir / arba. Išimtis yra sąlygos, kurios negali būti atskirtos brūkšniu ar brūkšniu.

Neteisinga paieškos frazės atitiktis pažymėta.simbolis ~. Pavyzdžiui, jei neprisimenate tikslios termino ar vardo formos, galite jį nurodyti paieškos juostoje su nurodytu simboliu ir galėsite gauti maksimalaus panašumo rezultatus.

Individualizuotos paieškos parinktys

Taip pat yra paieškos galimybių, tokių kaip intitle,ir incategory. Jie yra dvitaškis atskirti filtrai formatu "filtras: užklausos eilutė". Užklausos eilutėje gali būti paieškos terminas ar frazė, dalis arba viso puslapio pavadinimas.

Funkcija "intitle: užklausa "teikia pirmenybę paieškos rezultatams pagal pavadinimą, bet taip pat rodo įprastus titro turinio rezultatus. Keli iš šių filtrų gali būti naudojami tuo pačiu metu. Kaip pasinaudoti šia galimybe?

Prašymas formos "intitle: oro uosto pavadinimas "parodys visus straipsnius su pavadinimu oro uosto pavadinimu. Jei mes suformuluosime tai kaip "automobilio stovėjimo vieta: oro uosto pavadinimas", tuomet jūs gausite straipsnius su pavadinimu oro uosto pavadinime ir nurodydami stovėjimo aikštelėje tekste.

Ieškoti pagal filtrą "kategorija: Kategorija "dirba pagal tam tikros grupės ar puslapių sąrašo straipsnių pirminio išleidimo principą. Pavyzdžiui, paieškos užklausa, pavyzdžiui, "Temples incategory: History", parodys teminius istorijos temos rezultatus. Ši funkcija taip pat gali būti naudojama kaip išplėstinė, nustatant įvairius parametrus.