UPOZORNĚNÍ: Kvalita vyhledávání je podmíněna kvalitou dostupných textových přepisů jednotlivých lístků. Každý lístek je napojen na automatický OCR přepis, ten však nemusí být zcela spolehlivý (špatně čitelné či ručně psané lístky). Verifikované množiny textových dat (upravený OCR přepis, segmentace lístku) vznikají aktivitou registrovaných uživatelů a do jejich schválení za jejich obsah administrátoři systému neručí. Položkový rozpis umožňující hledání dle jednotlivých polí není momentálně systematicky vyplňován. Jakmile bude pro určitou množinu dat plně použitelný, bude tato skutečnost zřetelně oznámena. FULLTEXTOVÉ VYHLEDÁVÁNÍ JE TEDY POUŽITELNÉ SPÍŠE JAKO DOPLNĚK NEŽ PLNOHODNOTNÝ EKVIVALENT PRŮCHODU KATALOGU DLE JEHO ŘAZENÍ.

Jazyk vyhledávacího dotazu

Vyhledávací engine je schopen nalézt jakýkoli znak v jakékoli ucelené sekvenci znaků od mezery do mezery (je možno použít "divoké karty", tj. znaky ? a *) nebo jakoukoli slovní sekvenci oddělenou mezerami (v tomto případě není možno využít "divoké karty"). Tyto dva vyhledávací přístupy nelze v rámci téhož dotazu kombinovat. Vyhledávací engine Lucene je blíže popsán zde.

Interpunkce vyhledávacího dotazu

Divoké karty vs. Ohraničení fráze

ZnakVýznamPříklad dotazuPříklad odpovědi
*Libovolně dlouhá souvislá řada znaků (0-nekonečno)st*lstal, strojil, stůl, stodol
  *st*l*přistáli, ustrojili, stoly, stodola
?Právě jeden libovolný znakst?lstůl, stal, styl
""Ohraničení fráze"písně kosmické"Najde všechny výskyty této slovní sekvence

Hledání pomocí divokých karet a ve slovních sekvencích nelze v jednom dotazu vzájemně kombinovat (tj. např. dotaz "st*l ?idle" engine neumí zodpovědět).

Vzhledem k možnostem výskytu šumů při OCR rekognoskaci doporučujeme pokládat dotaz ve tvaru *hledanýřetězec*.

Vyhledávací znaky

ZnakVýznamPříklad dotazuPříklad odpovědi
""Ohraničení fráze"písně kosmické"Najde všechny výskyty této slovní sekvence (nelze využít divoké karty)
~Podobnoststůl~0.8najde všechna slova podobná výchozímu z 80 %
""~Vzdálenost"písně kosmické"~10najde všechny případy, kdy jsou obě slova vzdálena maximálně n slov od sebe
{ }Exkluzivní interval{1901 TO 1905}Najde všechny případy, kdy se v definované množině textů vyskytuje řetězec spadající do uvedeného intervalu s vyloučením krajních hodnot
[ ]Inkluzivní interval[1901 TO 1905]Najde všechny případy, kdy se v definované množině textů vyskytuje řetězec spadající do uvedeného intervalu včetně krajních hodnot

Znaky pro kombinovaný dotaz

ZnakVýznamPříklad dotazuPříklad odpovědi
+ / AND / &&slučování+Němcová +BabičkaVšechny záznamy, kde se objevují oba řetězce současně
- / NOTnegace+Němcová -BabičkaVšechny záznamy, kde se objevuje první, ale nikoli druhý řetězec
OR / ||alternace+Němcová OR BabičkaVšechny záznamy, kde se objevuje první nebo druhý řetězec
( )výběr části+(Němcová OR Babička) +1855Všechny záznamy, které obsahují třetí a buď první, nebo druhý řetězec

Kombinovaný dotaz lze různě rozvíjet pomocí uzavření jeho části do kulatých závorek ( ).

Pomocí znaků pro kombinovaný dotaz lze v dotazu kombinovat části využívající principu divokých karet a části využívající principu slovní sekvence, tj. engine zodpoví např. dotaz +„Božena Němcová“ +*Babi?ka*.

Před vybranou množinu znaků majících význam při formulaci dotazu (+ - && || ! ( ) { } [ ] ^ " ~ * ? : \) je pro jejich vyhledání nutno před každý jednotlivý z nich zapsat zpětné lomítko.