PAGALBA

Tekstinės paieškos išraiškos

Tekstinės paieškos išraiška apibrėžia dokumentų paieškos kriterijus. Išraiška susideda iš paieškos objektų (žodžių ir frazių) bei kitų komponentų, tokių kaip operatoriai ir specialūs simboliai, kurie leidžia vartotojui tiksliai nurodyti, kokių dokumentų reikia ieškoti.

Paieškos objektai

Paieškos objektai gali būti žodžiai ir frazės.

Žodžiai ir frazės

Paieškos išraiškoje žodžius gali jungti operatoriai, atliekantys su žodžiais veiksmus. Jei išraiška susideda iš kelių žodžių, atskirtų tik tarpais (be operatorių), tai tokia žodžių eilutė laikoma fraze ir užklausos vykdymo metu ieškoma jos visos.

Paieškos išraiškos komponentai

Be paieškos objektų į išraišką gali įeiti vienas arba keli papildomi komponetai:
Komponentas Paskirtis
Loginiai operatoriai Apibrėžia loginį sąryšį tarp objektų paieškos išraiškoje.
Šablono ženklai Išplečia paieškos objektus, panaudojant šablonus.
Grupavimo simboliai Grupuoja paieškos objektus ir operatorius išraiškoje.

Loginiai operatoriai

Loginiai operatoriai sujungia objektus - pavienius žodžius ir frazes - į paieškos išraišką. Tarpų skaičius šalia loginio operatoriaus išraiškoje nesvarbus.

Operandais gali būti tiek paieškos objektai, tiek ir kiti operatoriai.

Operatorius AND (IR)

Operatorius AND naudojamas, ieškant dokumentų, kuriuose bent vieną kartą sutinkamas kiekvienas iš paieškos objektų. Pavyzdžiui, norint rasti visus dokumentus, kuriuose yra žodžiai seimas, respublikos ir lietuvos, reikia suformuoti paieškos išraišką: 'seimas & respublikos & lietuvos'

Operatorius OR (ARBA)

Operatorius OR naudojamas, ieškant dokumentų, kuriuose yra bent vienas iš paieškos objektų. Pavyzdžiui, norint rasti visus dokumentus, kuriuose yra žodis seimas arba žodis parlamentas, reikia nurodyti tokią išraišką: 'seimas | parlamentas'

Operatorius NOT (NE)

Operatorius NOT naudojamas, ieškant dokumentų, kuriuose yra vienas paieškos objektas, bet nėra kito. Pavyzdžiui, norint rasti dokumentus, kuriuose yra žodis parlamentas, bet nėra žodžio vyriausybė, reikia naudoti tokią išraišką: 'parlamentas ~ vyriausybė'

Panašiai, norint rasti dokumentus, kuriuose yra žodis transportas, bet nėra automobiliai ir traukiniai, reikia naudoti išraišką: 'transportas not (automobiliai or traukiniai)'

Ekvivalentumo operatorius

Ekvivalentumo operatorius naudojamas, kai paieškoje žodžiui reikia nurodyti pakaitalą. Pavyzdžiui, jei reikia surasti visus dokumentus, kuriuose yra frazė parlamentas išleido įstatymą arba seimas išleido įstatymą, galima rašyti: 'parlamentas=seimas išleido įstatymą'
Ekvivalentumo operatoriaus pirmenybė
Ekvivalentumo operatorius turi aukščiausią prioritetą prieš visus kitus operatorius.
Operatorius Syntaksė Paaiškinimas
AND žodis1&žodis2
žodis1 and žodis2
Randa dokumentus, kuriuose yra žodis1 ir žodis2. Dokumente turi būti abu žodžiai.
OR žodis1|žodis2
žodis1 or žodis2
Randa dokumentus, kuriuose yra žodis1 arba žodis2. Turi būti bent vienas žodis.
NOT žodis1~žodis2
žodis1 not žodis2
Randa dokumentus, kuriuose yra žodis1 , bet nėra žodis2
Ekvivalentumas žodis1=žodis2
žodis1 equiv žodis2
Nurodo, kad žodis2 yra priimtinas žodžio žodis1 pakaitalas.

Operatorius NEAR (GRETA)

Operatorius NEAR naudojamas, ieškant dokumentų, kuriuose paieškos objektai yra netoli vienas nuo kito - ne toliau, negu per 100 žodžių. Pavyzdžiui, norint rasti visus dokumentus, kuriuose yra žodžiai fiziniai ir asmenys, ir jie yra netoli vienas nuo kito, reikia nurodyti tokią išraišką: 'fiziniai ; asmenys' arba 'fiziniai near asmenys'. Paieškos objektų tvarka išraiškoje reikšmės neturi.

Šablono simboliai

Šablono simboliai naudojami išraiškose, kai žodžių paiešką norima išplėsti į šablonų paiešką. Šablono simboliai yra:
Šablono simbolis Paaiškinimas
% Procento simbolis reiškia, kad jo vietoje gali būti bet kokie simboliai.
* Žvaigždutės simbolio reikšmė yra ta pati, kaip ir procento simbolio.
Pastaba: Šabloninės paieškos išplėtimui sistema naudoja dokumentų tekstų arba pavadinimų žodžių sąrašus. Jei šabloninė paieška išsiplečia iki žodžių skaičiaus, kuris didesnis už didžiausią leistiną, sistema pateikia pranešimą apie klaidą "pernelyg sudėtinga užklausa".

Grupavimo simboliai

Grupavimo simboliai keičia operatorių prioritetą, grupuodami išraiškoje paieškos objektus ir operatorius. Grupavimo simboliai yra: Paieškos objektų ir operatorių grupės pradžią žymi atidarantysis simbolis iš vienos iš grupavimo simbolių aibių. Grupės pabaigą žymi atitinkamas uždarantysis simbolis. Tarp šių simbolių gali būti kitų grupių.

Pavyzdžiui, atidarantysis skliaustas žymi grupės pradžią. Pirmasis toliau sutiktas uždarantysis skliaustas žymi grupės pabaigą. Visi kiti atydarantieji skliaustai, sutikti prieš uždarantįjį, žymi įdėtąsias grupes.

Operatorių pirmenybė

Operatorių pirmenybė yra tvarka, kuria apskaičiuojami paieškos išraiškos komponentai.

Visais atvejai išraiškos komponentai apskaičiuojami iš kairės į dešinę, laikantis jų pirmenybės. Operatoriai su aukštesniu prioritetu pritaikomi pirmiau. Vienodos pirmenybės operatoriai pritaikomi pagal jų buvimo išraiškoje tvarką iš kairės į dešinę.

  1. EQUIV =
  2. NOT ~
  3. AND &
  4. OR |

© Lietuvos Respublikos Seimo Informacijos technologijų skyrius.
Pastabos ir pasiūlymai - webadm@lrs.lt