Apache Solr

Najlepšie samoobslužné vyhľadávače

Najlepšie samoobslužné vyhľadávače
Vie váš šéf, že si hľadáte inú prácu? Povedali ste svojej polovičke o nemožnosti rozhodnúť sa, či chcete mať deti alebo nie? Vy rodičia viete o svojej sexuálnej orientácii? Google a ďalšie významné vyhľadávače to vedia.

„Väčšina používateľov prehľadáva Google, keď je prihlásená, takže sú k dispozícii všetky informácie o ich online živote: vyhľadávania YouTube, e-maily a história minulých vyhľadávaní,“ hovorí Adam Tauber, vedúci vývojár metasearch enginu Searx, ktorý rešpektuje súkromie.

Samozrejme, môžete použiť Tor na anonymitu a vždy po každom vyhľadávaní vymazať všetky stopy svojej aktivity, ale to by po každom vyhľadávaní s najväčšou pravdepodobnosťou dosť rýchlo zostarlo. Namiesto toho by ste mali zvážiť inštaláciu samoobslužného vyhľadávacieho nástroja, ktorý je schopný načítať informácie za vás bez toho, aby o vás zverejnil niečo citlivé.

Vybrali sme dva takéto vyhľadávače a predstavujeme tiež ďalšie tri vyhľadávače, ktoré vám ukážu, že vynikajúce alternatívy k proprietárnym vyhľadávačom ako Google alebo Bing už existujú a ich inštalácia a použitie je jednoduchšie, ako si myslíte.

1. YaCy

YaCy je bezplatne distribuovaný peer-to-peer vyhľadávací nástroj, ktorého hlavná súčasť je napísaná v jazyku Java. Pretože všetci používatelia YaCy sú si rovní a pretože vyhľadávač neukladá požiadavky na vyhľadávanie používateľov, cenzúra jednoducho nie je možná.

V súčasnosti YaCy indexuje asi 1.4 miliardy dokumentov v jej indexe vďaka aktivite viac ako 600 rovnocenných operátorov, ktorí do nej každý mesiac prispievajú. Pre porovnanie, index Google Search obsahuje stovky miliárd webových stránok a má veľkosť viac ako 100 000 000 gigabajtov.

Aj keď YaCy čaká ešte dlhá cesta, kým bude môcť konkurovať najväčším centralizovaným vyhľadávačom na svete, je už použiteľný ako vyhľadávací portál pre súkromné ​​intranety a aplikácie špecifické pre daný projekt, pretože YaCy môže fungovať ako jediné vyhľadávacie zariadenie bez toho, aby musel spolupracovať s inými sieťami. rovesníci.

YaCy možno ľahko integrovať do ľubovoľnej webovej stránky vďaka svojim jednoduchým úryvkom kódu, ktoré je možné bez problémov kopírovať a prilepovať.

2. Searx

Searx je popisovaný ako hackovateľný metasearch engine rešpektujúci súkromie. Je k dispozícii pod licenciou GNU Affero General Public License verzie 3 a jeho hlavným cieľom je ochrana súkromia používateľov tým, že nikdy nebudú zdieľať adresy IP používateľov ani históriu vyhľadávania s vyhľadávacími nástrojmi, z ktorých zhromažďuje výsledky.

„Pri použití Searxu sa IP adresa Searxu, náhodného User-Agenta a vyhľadávacieho dotazu štandardne odosielajú,“ vysvetľuje Adam Tauber, alias asciimoo, ako funguje jeho metasearch engine. "Searx môžete samozrejme prispôsobiť tak, aby posielal ďalšie ďalšie parametre, ako je vyhľadávací jazyk alebo číslo stránky požadovanej stránky s výsledkami.".“

Searx automaticky blokuje všetky sledovacie cookies poskytované vyhľadávačmi, aby zabránil modifikácii výsledkov založených na profilovaní používateľov, čo môže byť výsledkom pokusu vyhľadávača implementovať vyhľadávanie, ktoré je individualizované na základe toho, čo motor o užívateľovi vie. Searx je stopercentne zadarmo a ktokoľvek ho môže podľa potreby upraviť. Môžete dokonca vziať kód Searx a spustiť metasearch engine na svojom serveri, ktorý by mal určite vyriešiť akékoľvek obavy týkajúce sa protokolov.

3. Elastické vyhľadávanie

ElasticSearch je vyhľadávací nástroj založený na Lucene, bezplatnej a otvorenej softvérovej knižnici na získavanie informácií podporovanej Apache Software Foundation a je vydávaný pod licenciou Apache Software License.

ElasticSearch poskytuje fulltextový vyhľadávací modul s webovým rozhraním HTTP. Vyhľadávač je možné použiť na prehľadávanie všetkých druhov dokumentov a je možné ho ľahko distribuovať do viacerých uzlov.

Je možné vytvoriť samoobslužný vyhľadávací stroj pomocou ElasticSearch a Docker a tu nájdete návod, ktorý popisuje tento proces.

4. Ambar

Ambar je open-source vyhľadávač dokumentov s mnohými užitočnými funkciami. Podporuje automatické indexové prehľadávanie, označovanie a okamžité fulltextové vyhľadávanie, len aby som uviedol niekoľko príkladov. Jednou z najzaujímavejších funkcií programu Ambar je jeho schopnosť vykonávať OCR na obrázkoch a súboroch PDF. Medzi podporované jazyky patrí angličtina, nemčina, ruština, taliančina, francúzština, španielčina, poľština a holandčina.

Ambar je možné ľahko nasadiť pomocou jedného súboru pre docker-compose a tu sa dozviete, ako na to.

5. Apache Solr

Apache Solr, napísaný v prostredí Java, je platforma podnikového vyhľadávania, ktorá obsahuje fulltextové vyhľadávanie, zvýraznenie prístupov, fazetové vyhľadávanie, indexovanie v reálnom čase, dynamické klastrovanie a mnoho ďalších dôležitých funkcií. Bol vytvorený v roku 2004 pre interný projekt v spoločnosti CNET Networks. Spoločnosť CNET Networks ju láskavo darovala nadácii Apache Software Foundation v roku 2006, kde v roku 2007 absolvovala inkubačný status samostatného projektu najvyššej úrovne.

Dnes je Solr vysoko spoľahlivá, škálovateľná a odolná voči chybám podniková platforma pre vyhľadávanie, ktorá podporuje vyhľadávacie a navigačné funkcie mnohých z najväčších svetových internetových stránok, vrátane DuckDuckGo, eHarmony a BestBuy. Môžeš

Ako nainštalovať a nakonfigurovať YaCy

Inštalácia YaCy je veľmi jednoduchá a trvá len pár minút, pretože nemusíte inštalovať externú databázu alebo webový server - YaCy je dodávaný so všetkým potrebným.

  1. Prejdite na oficiálnu webovú stránku YaCy a stiahnite si najnovší balík pre Linux.
  2. Nainštalujte si runtime prostredie OpenJDK 8.
    • Ak používate distribúciu založenú na Debiane, použite nasledujúci príkaz: $ sudo apt-get install openjdk-8-jre
    • Ak nie, postupujte podľa pokynov špecifických pre vašu distribúciu.
  3. Rozbaľte stiahnutý balík na požadované miesto.
  4. Prejdite do nového priečinka a spustite „startYACY.sh “skript v Termináli.
  5. Mali by ste vidieť potvrdzujúcu správu s informáciou, že YaCy začal ako démon

Záver

Vyhľadávače o nás vedia viac, ako by väčšina ľudí chcela pripustiť. Ak by ste chceli prestať kŕmiť šťavnaté dáta veľkými spoločnosťami, môžete veci vziať do svojich rúk a nastaviť si hosťovaný vyhľadávací modul na ochranu svojho súkromia. Aj keď samoobslužné vyhľadávače majú pred sebou ešte dlhú cestu, kým sa stanú plne použiteľnými, existuje tu potenciál na to, aby prekonali výkony ako Google, a jeho zachytenie je len otázkou prilákania ďalších používateľov.

Hry OpenTTD vs Simutrans
OpenTTD vs Simutrans
Vytvorenie vlastnej simulácie dopravy môže byť zábavné, relaxačné a mimoriadne lákavé. Preto sa musíte uistiť, že vyskúšate čo najviac hier, aby ste n...
Hry Výukový program OpenTTD
Výukový program OpenTTD
OpenTTD je jednou z najpopulárnejších obchodných simulačných hier. V tejto hre musíte vytvoriť úžasné dopravné podnikanie. Začnete však na začiatku ok...
Hry SuperTuxKart pre Linux
SuperTuxKart pre Linux
SuperTuxKart je vynikajúci titul navrhnutý tak, aby vám priniesol zážitok z hry Mario Kart zadarmo na vašom systéme Linux. Je to dosť náročné a zábavn...