Prüfungsfragen zu Suchkompetenz Flashcards

1
Q

Aus welchen Basiskomponenten besteht eine ISM?

A

Crawler: startet mit Start-URL oder liste von URL’s und fragt zuerst diese URL’s ab, dann (sucht und fall es passende hrefs findet) verfolgt gefundene Links zu neuen Quellen.

Parser/Indexer: Parser takes the document and splits it into indexable text fragments.
Indexer nimmt Text-Fragmente, zerlegt es in in einzelne Wörter, dann wendet die linguistische Algorithmen und Gewichtungsmethoden an
-> übergibt Ergebnis in Datenbank
In Solr hat die Indexierungs-Arbeit für uns gemacht.

Datenbank: Speichert die extrahierten und aufbereiteten Daten in Datenstrukturen .

Searcher: i.e. Benutzeroberfläche: Der Benutzer greift über seinen Browser auf das Such-Interface zu, das die Anfragen an die Datenbank übergibt und die Antwortrangliste aufbereitet und an den Benutzer zurückgibt. Dei verschiedene Eingabeschnittstelen sind Kommandosprachen, Formulare (Google) und Menüs (Amazon Produkt-Suche).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welche Dokumente sind überhaupt suchbar?

A
    1. Die Suchmaschine muss Zugriff auf das Dokument haben. Das Dokument muss öffentlich zugänglich sein. Das Dokument muss durch Verlinkung erreichbar sein, und es robots.txt sollte Zugang erlauben.
      1. Die Webseite soll aktuell sein.
      2. Das Dokument sollte in HTML oder bekanntem Format sein.
      3. Die Sprache der Website muss passen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche linguistischen Funktionen finden sich in ISM?

A

(typical search functions in the user’s GUI when they search for a document.) Sie sind übliche Suchfunktionen für den Benutzer bei der Suche nach einem Dokument in der Benutzeroberfläche, basiered auf Zweichenkettenvergleich.
1. Wortnormalisierung - verschiedene Schreibweisen normalisieren
2. Grundformreduktion - linguistische Grundform finden: Bsp: Häuser – Hauses – Hause – Haus
3. Phrasen - Abstandsuche in einer Phrase - Bsp mit ‘*”: “information retrieval”, “retrieval * information” (?)
4. Komposita: trennen von zusammengesetze Befriffe (?)
5. Synonyme - nach Synonymen suchen
mit ‘∼’: Beispiel: Handy Mobiltelefon Smartphone <=> ∼handy

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nennen Sie Beispiele für Anfrageoperatoren!

A

Anfragesprache: man benutzt die Anfragesprache umkomplexere Anfragen in der Such- Benutzeroberfläche. zu formulieren.

Google Operator:

  1. boolesche Operatoren, UND ODER, -
  2. Zahlenbereiche: 100..200 Euro
  3. Facetten: Einschränkung nach Google Facetten (Bilder, Maps, .., Ort, Sprache ..)
  4. Feld-Prädikate: inurl:, intext:, …
  5. URL- Prädikate: link:x (Sites with links to x), filetype:, related:x (Sites with same in and out-going links, …. Ex: link:uni-due.de - site:uni-due
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche Faktoren können das Ranking einer Webseite beinflussen?

A

wichtige Faktoren sind oft:
• Die Suchbegriffe kommen h¨aufig in der Seite vor.
• Die Suchbegriffe kommen in Ankertexten vor.
• Page rank ist die Popularit¨at einer Seite anhand ihrer Verlinkung mit anderen (popul¨aren) Seiten.
• Diversit¨at: Die ersten Antworten soll m¨oglichst viele Aspekte der Anfrage abdecken.
• Nutzer-Klicks auf Antworten werden heute standardm¨aßig alle protokolliert, damit das System lernt, welche Seiten bevorzugt angeklickt werden. Hierbei geht nicht nur die Gesamtheit aller Klicks zur selben Anfrage, sondern auch die Klicks des betreffenden Nutzers bei fruheren Anfragen sowie ggfs. ¨
die Klicks seiner Freunde aus Google+ in die Bewertung einer Seite ein. (Learning to Rank K6)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly