English English French French Spanish Spanish German German
Geekflare wird von unserem Publikum unterstützt. Wir können Affiliate-Provisionen durch den Kauf von Links auf dieser Website verdienen.
Teilen:

7 Selbst gehostete leistungsstarke Suchmaschinen-Software für Ihr Produkt

Invicti Web Application Security Scanner – die einzige Lösung, die eine automatische Verifizierung von Schwachstellen mit Proof-Based Scanning™ bietet.

Es erscheint entmutigend, aber das Hinzufügen einer leistungsstarken Suchfunktion zu Ihrer Anwendung ist weder komplex noch zeitaufwändig. Hier sind einige solide Empfehlungen!

Während viele Technologien in den letzten 2-3 Jahrzehnten beeindruckt haben, gehört die Suche zu den ganz wenigen, die zu einem festen Bestandteil unseres Lebens geworden sind. Es ist überall – E-Commerce-Websites, Blogs, Wissensbasenund mehr - nicht weil ein Suchfeld und ein Symbol cool aussehen, sondern weil es etwas tut, das dringend benötigt wird.

Was tun Sie, wenn Sie als Unternehmen nach einer guten Suchlösung suchen oder Ihre bestehende Lösung satt haben?

Zum Glück müssen Sie weder lächerliche Lizenzgebühren zahlen noch ein Team von 20 Entwicklern und Systemadministratoren unterhalten. Heute habe ich einige Suchmaschinenempfehlungen, die in kürzester Zeit installiert und integriert werden können, insbesondere von kleinen Unternehmen mit Entwickler Teams der Größe 1-2.

MeiliSearch

Eine der besten und hochwertigsten Suchmaschinen, auf die Sie stoßen werden, ist MeiliSuche.

Was bringt mich dazu, MeiliSearch zu meinen Top-Empfehlungen zu zählen?

Hier geht.

Open Source

Der gesamte Quellcode für MeiliSearch ist offen verfügbar GitHub. Das bedeutet, dass Entwickler jeden Teil des Codes selbst untersuchen können. Im Gegenzug können sich Unternehmen auf Qualität und Absicht verlassen (z. B. keine Hintertüren oder Scanner im Programm). Und natürlich können sachkundige Entwickler dazu beitragen, die Technologie noch weiter zu verbessern.

Großartiges UX

MeiliSearch hat keine komplexen Regeln (wie "a - b" bedeutet a, aber nicht b). Geben Sie Ihre Suche einfach auf natürliche Weise ein, und die Ergebnisse werden flüssig angezeigt. Der Motor ist sehr tolerant und akkommodierend und liefert auch bei Verwendung von Tippfehlern oder Synonymen genaue Ergebnisse. Es werden auch mehrere Sprachen unterstützt.

Großartiger DevEx

Entwickler werden MeiliSearch lieben! Es ist nicht nur anpassbar und skalierbar, sondern auch als REST-API! Dokumentation ist auch ausgezeichnet und vollständig. Während das Tätigen von HTTP-Aufrufen in jeder Sprache trivial ist, werden Beispiele aus fünf Sprachen (JavaScript, Ruby, Python, Golang und PHP) für diejenigen angegeben, die es eilig haben.

Einfache Suchlösungen sollten einfach zu verwenden und einzurichten sein. Daher überprüft MeiliSearch alle Kontrollkästchen! Wenn Sie fortfahren möchten, können Sie loslegen DigitalOcean mit einem Klick.

Solr

Solr, Teil des Apache-Projekts, gibt es schon seit einigen Jahren. Es basiert auf der bekannten und äußerst zuverlässigen Lucene-Bibliothek, die auch die beliebte Suchlösung ElasticSearch unterstützt. All dieses Hokuspokus bedeutet, dass Solr zu den leistungsstärksten, skalierbarsten, standardkonformsten, funktionsreichsten und vertrauenswürdigsten Suchlösungen gehört.

Es wird von Giganten wie Disney, eBay, Netflix, Zappos und BestBuy verwendet. Dies bedeutet jedoch nicht, dass Sie keine kleinere, einfachere Installation ausführen können (z. B. Einzelcomputer, keine Skalierung, kein Failover - manchmal ist das in Ordnung) und dieses Kraftpaket namens Solr verwenden können.

Warum also Solr verwenden?

Hier sind einige gute Gründe.

Genau und kraftvoll

Solr gehört zu den genauesten, leistungsfähigsten und leistungsfähigsten Suchsystemen der Welt. Außerdem ist es Open Source, was erklärt, warum große Namen (wie bereits erwähnt) sich darauf eingestellt haben. Die Fähigkeit, Dokumente zu verarbeiten und Suchanfragen zu beantworten, ist unübertroffen.

Einfache Installation und Wartung

Die Installation von Solr ist so einfach wie das Dekomprimieren und Ausführen des Programms. Bei einfachen Einzelmaschinensystemen ist keine komplizierte Wartung erforderlich; Behalten Sie die RAM-Nutzung im Auge, da Suchlösungen im Allgemeinen und Java-basierte Technologien im Besonderen ziemlich RAM-hungrig sein können (weil sie alles im RAM behalten oder versuchen, alles im RAM zu behalten, um schnelle Lese-/Schreibvorgänge zu ermöglichen).

Admin Panel

Solr wird mit einem Admin-Panel geliefert, das eine visuelle Überwachung und Konfiguration ermöglicht. Mit etwas trivialem Training können auch Nicht-Entwickler lernen, die wichtigsten Diagramme zu lesen. Nicht viele Suchlösungen auf dieser Liste verfügen über Funktionen wie diese.

Bildquelle: Offizielle Seite

API-gesteuert, standardkonform

Solr bietet eine Ergebnisschnittstelle in einer API, die mehrere Formate verarbeiten kann - JSON, CSV, XML und Binär. Es gibt Überwachungsdaten gemäß dem JMX-Standard aus, ein großer Segen für Java-Entwickler.

Es gibt noch viel mehr für Solr zu sagen, aber der Versuch, alles abzudecken, wird uns bis ans Ende der Zeit führen. 😂 Es genügt zu sagen, dass Solr eine erstklassige Lösung ist und Sie nichts falsch machen können, egal mit welcher Art von Daten Sie arbeiten.

Elasticsearch

Elasticsearch war und ist wohl immer noch ein Pionier in der Freiform-Textsuche. Selbst heute, wenn Sie einen Programmierer oder Systemadministrator um eine Empfehlung für Suchmaschinen bitten, ist Elasticsearch höchstwahrscheinlich die einzige Name, den sie sich einfallen lassen werden. Sicher, heutzutage wird ein beträchtlicher Teil so etwas empfehlen Algolia Auch, aber wir haben bereits erläutert, wie sich das auswirkt. 🤪

Lassen Sie sich nicht von der Schaltfläche "Kostenlose Testversion starten" in der obigen Grafik irreführen. Während der Kern Elasticsearch Die Technologie selbst ist Open Source und kostenlos. Das Unternehmen versucht, seine Bemühungen zu monetarisieren und Unternehmen anzusprechen. Daher sehen Sie hier tatsächlich die Testversion des Cloud-Dienstes, die die Verwaltung von Elasticsearch vereinfacht, insbesondere wenn Cluster beteiligt sind.

Uff, so viele Netze zum Entwirren. Lassen Sie uns noch einmal zusammenfassen: Elasticsearch ist Open Source und kostenlos, und jeder kann es einfach einrichten und ohne Einschränkungen verwenden.

Lassen Sie uns nun wie erwartet die Gründe für die Wahl von Elasticsearch untersuchen:

  • Reifen, kampferprobt Suchmaschine. Dies bedeutet, dass Sie mit größerer Wahrscheinlichkeit Lösungen finden, wenn Sie mit „seltsamen“ Fehlern konfrontiert sind.
  • Erstklassiger Fokus auf Clustering, Skalierbarkeit und asynchrone Schreibvorgänge.
  • Zugänglich über a einfache REST-API (was alle anderen letztendlich kopierten).
  • Dokumentorientiert aber unterstützt Schema wenn benötigt.
  • Wahnsinnig schnell und genau Ergebnisse angezeigt konfigurierbare Suchgeschwindigkeit.
  • Stellar Dokumentation, sowohl in der Menge als auch in der Nützlichkeit.
  • Eine vollständige Suche und Analyse Cloud-Plattform (Das ELK-Stapel), wenn Sie für die Bequemlichkeit bezahlen möchten.

Der einzige Nachteil, den ich gegen Elasticsearch haben würde, ist der massive RAM-Verbrauch. Ich meine, als Berater ist es schwierig genug, Kunden davon zu überzeugen, in einen Server zu investieren, der 20 US-Dollar pro Monat kostet, was leider nicht annähernd den Anforderungen von Elasticsearch entspricht.

Wenn Sie neugierig auf Elasticsearch sind, lesen Sie dies Udemy natürlich.

Typesense

Typensinn ist eine leichte, unkomplizierte und dennoch leistungsstarke Suchmaschine. Wer nach Nützlichkeit und Einfachheit sucht, sollte dies unbedingt ausprobieren.

Eines der besten Dinge an Typesense ist, dass Sie es direkt auf der Website ausprobieren können. Dies kann Frustration und Zeit sparen, wenn Sie alles einrichten und die API ausprobieren. . . Nur um festzustellen, dass eine oder mehrere der Funktionen nicht so funktionieren, wie Sie es sich gewünscht haben.

Das heißt nicht, dass der Motor möglicherweise fehlerhaft ist. Es ist nur so, dass die Einstellung der Engine zu etwas nicht Ihre Präferenz ist oder dass sie in Konflikt mit Ihrer Geschäftsdomäne steht. Tippfehler, spezielle Symbole, Synonyme und mehr. . . Sie können die Ergebnisse überprüfen, die die Engine direkt auf der Homepage ausgibt (sie verwenden hierfür eine Buchdatenbank).

Wie Sie sehen können, befindet sich dieser Abschnitt direkt unter dem obersten. In das Suchfeld habe ich die Suchanfrage „tra“ eingegeben und unten sehe ich passende Ergebnisse aus der Bücherdatenbank (sowie Metadaten – Gesamtergebnisse, aktuelle Seite usw.).

Typesense hat viel zu bieten, wenn es um eine Suchmaschine Ihrer Wahl geht:

  • Die Technologie dahinter ist voll Open-Source- und einladend.
  • Einfach zu konfigurieren HA (Hochverfügbarkeit) Setup, falls Sie eine benötigen.
  • Tolerant wenn es um Tippfehler und anderes Rauschen bei Suchanfragen geht.
  • An erweiterte Filterung System für diejenigen, die eine feinkörnige Kontrolle der Suchergebnisse benötigen.
  • Einfacher REST API, obwohl ihre Dokumente Sie extra hart arbeiten lassen, um es zu finden!
  • Kunden (SDKs) sind für einige der Hauptfächer verfügbar Sprachen (JavaScript, Python, Ruby und PHP).

Wenn Sie die Idee haben, neue Server einzurichten, hat Typesense auch eine Cloud-Angebot wo die Bereitstellung einen einzigen Klick erfordert. Die Abrechnung erfolgt stundenweise, und Lese- und Schreibvorgänge werden nicht gemessen. Ehrlich gesagt sage ich, dass dies für die meisten Unternehmen die bessere Option ist, vorausgesetzt, sie haben die Preise im Voraus ausgearbeitet und sichergestellt, dass es sich um einen Nettogewinn handelt.

Alles in allem macht Typesense sehr viel Sinn (kein Wortspiel beabsichtigt!), Wenn Sie etwas Kleines, Schickes, Präzises und ein echtes Arbeitstier brauchen.

Sonic

Schall ist stolz darauf, eine ElasticSaerch-Alternative zu sein, die mit „ein paar MB RAM“ ausgeführt wird.

Wie ist das möglich?

Nun, die Java Virtual Machine (JVM) ist bekanntermaßen RAM-hungrig (im Allgemeinen verbraucht das Starten der JVM ungefähr 1 GB RAM). Kein Wunder also, dass etwas, das in der Rust-Sprache codiert ist (was Entwicklern volle Kontrolle und Speichersicherheit bietet), genauso schnell ausgeführt werden kann und nur wenige MB RAM benötigt.

Entspann dich, alle zusammen! Das ist nur das Projektmaskottchen.

Zum Zeitpunkt des Schreibens sind einige Unternehmen unter den Nutzern aufgeführt, obwohl ich sicher bin, dass es einige weitere gibt, die sich nicht die Mühe gemacht haben, ihre Namen hinzuzufügen. Ich erinnere mich nicht, wie oder wie genau der Zeitrahmen war, aber ich bin früher auf Sonic gestoßen. Zu dieser Zeit, als ich mich über eine Alternative mit wenig Speicher freute, dachte ich, es würde Zeit brauchen, um versteckte Fehler zu stabilisieren und auszubügeln. Nun, es sieht so aus, als wären sie mehr oder weniger angekommen. Wie beliebt Sonic wird, wird nur die Zeit zeigen.

Okay, abgesehen von so langen Überlegungen, warum sollten Sie Sonic für Ihre Organisation / Ihr Projekt verwenden?

Hier sind einige Gründe:

  • Äußerst wenig Speicher Fußabdruck, soweit Suchmaschinen gehen.
  • Bibliotheken sind verfügbar für alle gängigen Programmiersprachen. Node, PHP und Rust sind das, was die Autoren selbst veröffentlicht haben, während andere von der Community erstellt wurden (freuen Sie sich, denn auch exotische Stiff wie Elixir und Nim werden behandelt!).
  • Mehrere Sprachen werden unterstützt (es war zu viel, um es zu zählen, aber ich denke, zum Zeitpunkt des Schreibens werden 40-50 Sprachen unterstützt).
  • Eine Überraschung! Sie können sogar verwenden neue Sprachen, und die Engine funktioniert (😂😂), obwohl Sie einige erweiterte Funktionen wie Stoppwörter verlieren.
  • Very schneller Motor. Wenn Sie sich die GitHub-Seite ansehen, werden Sie feststellen, dass die Aufnahme- und Suchzeiten in mehreren Fällen in Mikrosekunden lagen! Dies war natürlich ein Einzelmaschinentest, da die Netzwerklatenz die Zahlen niemals so niedrig halten wird.

Wenn Sie diesen Motor in Aktion sehen möchten, gehen Sie zu fehlen uns die Worte. Link (eine ihrer Benutzerfirmen) und spielen Sie mit dem Suchfeld, das Sie dort sehen:

Es gibt bestimmte Einschränkungen für Sonic als Suchmaschine. Die Entwickler haben sie auf ihrer GitHub-Seite hervorgehoben und offen diskutiert. Mein Rat wäre, diese Liste genau zu prüfen und festzustellen, dass Ihre Anwendungsfälle nicht mit ihrer Domäne übereinstimmen. Allerdings hat alles Grenzen; es ist nur so, dass sie verborgen gehalten werden, und so merken wir es nicht, bis es zu spät ist. Daher halte ich Sonic für eine gute Wahl für eine Suchmaschine.

TNTSearch

Wir haben jetzt einen faszinierenden Eintrag auf dieser Liste. Das erste Interessante ist, dass diese produktionsreife Suchmaschine mit allen Funktionen in PHP geschrieben wurde!

Ja, von allen möglichen Sprachen PHP. Und ich sage das nicht, weil ich PHP hasse, sondern weil es von Natur aus ein kurzlebiger Prozess ist.

Das zweite interessante ist ihre Lizenz, zumindest zum Zeitpunkt des Schreibens. Eigentlich ist die Lizenz selbst MIT, daher gibt es dort keine Probleme, aber die Autoren klassifizieren diese Software als PS4Ware. wenn du benutzt TNTSuche In der Produktion solltest du ihnen ein PS4-Spiel schicken! 😂😂 Jetzt ist es nicht obligatorisch, wie das "sollte" anzeigt, aber es ist unglaublich lustig. Ich hoffe auch, dass sie es auf eine PS5-Lizenz aktualisieren, obwohl es momentan zu früh ist.

Da ich selbst einen starken PHP + Laravel-Hintergrund habe, schätze ich die Bemühungen dieser Jungs sehr. Ihr Website sagt nicht viel, scheint aber darauf hinzudeuten, dass es sich um Berater handelt. Ich empfehle Ihnen daher dringend, sich an sie zu wenden, wenn Sie Projekte haben!

Gibt es gute Gründe, TNTSearch in Ihren Projekten einzusetzen?

Ja, es gibt:

  • In PHP für PHP von PHP codiert. Das PHP-Ökosystem braucht engagiertere, qualitativ hochwertigere Lösungen wie diese.
  • Wichtige Funktionen wie ungenaue Suche, Geo-Suche und Textklassifizierung.
  • Einfach zu Übernehmen SuchindexDies ist eine große Flexibilität, die vielen Lösungen fehlt.
  • Stemming, BM25-Ranking und benutzerdefinierte Tokenisierung sorgen dafür hohe Genauigkeit.
  • Einfache Bereitstellung - genau wie jedes andere Composer-Paket!

Sie können die Motorleistung überprüfen hier und überzeugen Sie sich selbst, wie schnell und genau es ist. Ich möchte den PHP-Aspekt noch einmal betonen: Wenn Sie ein PHP-Projekt pflegen, möchten Sie so weit wie möglich innerhalb der PHP-Wände bleiben (warum? Denken Sie an die Kosten für die Umschulung). Und für solche Fälle bringt TNTSearch ein Wertversprechen, das schwer abzulehnen ist!

Vespa

Vespa ist ein breites und schweres Angebot. Wie einige andere Einträge in dieser Liste ist sie zu groß, um in wenigen Worten erfasst zu werden. Aber ich muss es versuchen, also werde ich es tun. 🙂 Vespa ist zwar eine Suchmaschine, aber die Verwendung als normale Suchmaschine verschwendet ihr Potenzial.

Vespa wurde entwickelt, um endlose Datenmengen (Big Data) zu verarbeiten und darüber hinaus Funktionen für maschinelles Lernen und endlose Anpassungen bereitzustellen.

Vespa positioniert sich als Konkurrent von Elasticsearch und traditionellen Datenbanken und bietet einen anständigen Vergleich darüber, was wann zu verwenden ist.

Wie Sie sehen können, macht die Vespa umso mehr Sinn, je näher Sie an maschinelles Lernen getriebenen Operationen herankommen möchten. Als reine Suchmaschine für ein kleines bis mittleres Unternehmen hat es meiner Meinung nach keine Vorteile gegenüber anderen Optionen.

Nun, wenn man bedenkt, dass Sie kontinuierlich riesige Datenmengen generieren und die Entscheidungsfindung verbessern möchten AI / ML (eine Beschreibung, die heute zu vielen SaaS-Unternehmen passt), hier ist der Grund, warum Vespa sehr sinnvoll ist:

  • Open Source: Keine seltsamen Lizenzen und keine Fangverträge. Und obendrein gibt es nichts zu bezahlen, obwohl ich immer wieder betone, dass Unternehmen eine regelmäßige Summe für die Projekte zahlen, die sie am häufigsten nutzen (sogar 50 USD / Monat helfen ihnen sehr).
  • Echtzeit: Vespa ist wirklich Echtzeit. Es kann nicht nur Daten verdauen, verarbeiten und nach eingehenden Daten suchen; sogar seine Konfiguration kann im laufenden Betrieb geändert werden.
  • Skalierbar und tolerant: Vespa ist trivial zu skalieren. Es reagiert auch sehr gut auf das plötzliche Verschwinden von Knoten und bietet eine hohe Zuverlässigkeit.
  • Ranking und Empfehlungen: Such-, Ranking- und Vespa-Empfehlungen können mit strukturierten Abfragen kombiniert werden, um wirklich genaue Ergebnisse zu liefern.
  • Schmerzlose KI / ML: Die Vespa wird mit hochwertigen, vorgefertigten ML-Modellen geliefert. Sie müssen nicht 20 Datenwissenschaftler einstellen, um Ihre Daten zu bereinigen und zu verwenden.
  • Benutzerdefinierte Plugins:  Es gibt eine Reihe von APIs, mit denen Entwickler benutzerdefinierte Java-Plugins erstellen können, falls sie die Funktionsweise der Engine ändern müssen.

Die Vespa ist zweifellos riesig, daher ist es für Teams klar, die etwas jenseits der Startstufe liegen - ob es sich um Teamgröße, technische Kompetenz, Infrastrukturbudgets, tägliches Datenvolumen oder etwas anderes handelt. Für dieses Segment wird Vespa einen Homerun starten und wird dringend empfohlen.

Fazit

Suche 🔎 ist leistungsfähig, Suche ist magisch und Suche ist überall!

Es könnte sogar schwarze Magie sein, aber heute gibt es keinen Grund, warum nicht jeder (natürlich mit etwas Entwicklerhilfe) davon profitieren kann. Von Unternehmen über Einzelpersonen bis hin zu Regierungen bieten die Suchmaschinen in dieser Liste ein nahezu müheloses Angebot mit exponentiellen Vorteilen und Auswirkungen.

Gehen Sie voran und erhalten Sie eine Cloud-Server und installieren Sie die oben aufgeführte Suchsoftware, die Sie gerne erleben möchten.

Danke an unsere Sponsoren
Weitere großartige Lektüre zum Thema Entwicklung
Macht Ihr Geschäft
Einige der Tools und Dienste, die Ihr Unternehmen beim Wachstum unterstützen.
  • Invicti verwendet das Proof-Based Scanning™, um die identifizierten Schwachstellen automatisch zu verifizieren und innerhalb weniger Stunden umsetzbare Ergebnisse zu generieren.
    Versuchen Sie es mit Invicti
  • Web-Scraping, Wohn-Proxy, Proxy-Manager, Web-Unlocker, Suchmaschinen-Crawler und alles, was Sie zum Sammeln von Webdaten benötigen.
    Versuchen Sie es mit Brightdata
  • Semrush ist eine All-in-One-Lösung für digitales Marketing mit mehr als 50 Tools in den Bereichen SEO, Social Media und Content-Marketing.
    Versuchen Sie es mit Semrush
  • Intruder ist ein Online-Schwachstellenscanner, der Cyber-Sicherheitslücken in Ihrer Infrastruktur findet, um kostspielige Datenschutzverletzungen zu vermeiden.
    MIT DER INTELLIGENTEN SCHADENKALKULATION VON Intruder