<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p
        {mso-style-priority:99;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
span.E-MailFormatvorlage20
        {mso-style-type:personal-reply;
        font-family:"Verdana",sans-serif;
        color:#44546A;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:70.85pt 70.85pt 2.0cm 70.85pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="DE" link="blue" vlink="purple">
<div class="WordSection1">
<div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<p><span style="color:#44546A">Liebe Kolleg*innen,<o:p></o:p></span></p>
<p><span style="color:#44546A">wie vergangenen Mittwoch angekündigt, leite ich euch Timms Infomail zum Searchlab weiter – verbunden mit der herzlichen Bitte und Aufforderung nach Herzenslust ausgiebig zu testen.<o:p></o:p></span></p>
<p><span style="color:#44546A">Liebe Grüße<o:p></o:p></span></p>
<p><span style="color:#44546A">Philippe<o:p></o:p></span></p>
<p><span style="color:#44546A"><o:p> </o:p></span></p>
<p>Liebe Collectors, hier die Winke zum Gebrauch des Searchlab: <o:p></o:p></p>
<p><strong>Login:</strong><o:p></o:p></p>
<p><b>* </b><a href="https://fdm.awhamburg.de/registry-searchlab/" target="_blank">https://fdm.awhamburg.de/registry-searchlab/</a><br>
* PW: <span style="font-size:10.5pt;font-family:"Courier New";color:black">braveoceandreamsparkbright</span><o:p></o:p></p>
<p><strong>und los geht's !</strong><o:p></o:p></p>
<p>Vorab: <o:p></o:p></p>
<p>* Was Ihr seht ist eine normale interne Suche, kein Agent Interface, einfach Suchbegriffe in das Eingabefeld eintragen. Agent Feedback (s. u.) dient nur intern unserem Verständnis<o:p></o:p></p>
<p>* Das hier ist nicht als User Interface gedacht (noch zu komplex) sondern dient uns selbst zum Testen, vornehmlich der  hybriden Suche, um Feedback zu Suchergrgebnissen zu geben und zu sehen, wie unsere Parameter das Ergebnis beeinflussen. <o:p></o:p></p>
<p>* Die Suche liefert bewusst (zur Fehlersuche) noch viel Noise, diese sollte aber, insbesondere durch unser Feedback, mehr und mehr nach hinten rutschen und < 1.0 scoren. <o:p></o:p></p>
<p>zu den [Advanced Settings]<o:p></o:p></p>
<p><strong>Text</strong>: Nur Schlagwortsuche (ein bisschen fuzzy)<br>
<strong>Semantisch</strong>: Ähnlichkeitssuche mit Vektor Embeddings (mehrsprachiger Sentence transformer, später würde ich gerne sprachspezifische Modelle nehmen)<br>
<strong>Hybrid</strong>: Kombination beider Ansätze <b><-- darum geht es mir eigentlich</b><o:p></o:p></p>
<p>Ergebnisse aus den Ressourcendomänen sind und bleiben getrennt in Tabs, weil sich kein sinnvolles Ranking aus Äpfeln, Birnen und Weintrauben bauen lässt, insbesondere bei der Vektorsuche dominieren inhaltlich arme Einträge (weniger komplexe Vektoren = besseres
 match auf alles) die ganz dünnen werden daher per default ausgeblendet. <o:p></o:p></p>
<p>In den Tabs: <o:p></o:p></p>
<p>* <strong>Cosine Scale</strong>: Steuert, wie semantisch ähnlich Ergebnisse zur Anfrage sein müssen<br>
-> Höhere Werte = nur sehr ähnliche Ergebnisse (strengere Übereinstimmung)<br>
-> Niedrigere Werte = vielfältigere Ergebnisse (lockerere Übereinstimmung)<o:p></o:p></p>
<p><strong>* Score Boost</strong>: Passt die Endbewertung je Ressourcentyp an<br>
 - Positive Werte (z.B. 0.1, 0.2, 0.5) erhöhen alle semantischen Scores und machen semantische Treffer   konkurrenzfähiger gegenüber Texttreffern, negative umgekehrt. <br>
  - Höhere Boosts können dazu führen, dass mehr Dokumente in den Ergebnissen erscheinen, auch bei geringerer   semantischer Ähnlichkeit
<br>
- In Kombination mit Cosine Scale bestimmt er den finalen semantischen Score-Beitrag<o:p></o:p></p>
<p><b>* KI-Assistent</b> (🤖-Button) in den Ergebnissen erklärt und bewertet Ergebnisse für uns, zur besseren Einschätzung. Diesewr Agent wird demnächst durch einen GraphRAG basieren Ahent ersetzt, der dann den gesamten Kontext der GEgistry als Knowledge Graph
 zur Verfügung hat. Er kann dann auch User bei der Suche ebsser beraten dun selbst Suchbegriffe generieren, die garantiert matchen<o:p></o:p></p>
<p><b>* Feedback Prinzip: </b><br>
-> Daumen runter: Ergebnis wird bei künftigen identischen Suchen ausgeblendet. <br>
-> Daumen hoch: Score des Ergebnisses wird bei künftigen identischen Suchen verdoppelt (Holzhammer, ich weiß).<o:p></o:p></p>
<p>-> [Expected somethiomg else?]: kam ein Ergebnis nicht, das wir erwartet hätten? Hier die komplette URL aus der Registry eintragen. Bei künftigen identischen Suchen wird es mit einem Score von 2*Median der gesamten Ergebnisse eingefügt. <o:p></o:p></p>
<p style="margin-bottom:12.0pt"><b>Idee: egal, was mit der Suche wird, dieses Feedback bleibt uns auch für andere Implementierungen erhalten, also keinen Quatsch eingeben.</b><o:p></o:p></p>
<p>* Qualitätsfilterung:<br>
--> Einträge mit geringer Informationsdichte (Titel < 5 Zeichen oder Beschreibung < 100 Zeichen) werden standardmäßig ausgeblendet, denn sie würden bei semantischer/hybrider Suche künstlich hoch ranken. Sie können kann per checkbox oder [unhide] eingeblendet
 werden<o:p></o:p></p>
<p><strong>Allgemeine Feedback-Richtlinien:</strong><o:p></o:p></p>
<p><strong>Positiv</strong>: Sehr relevante, nützliche Ergebnisse, insbesondere bei Scores <1-
<br>
Wenn ein relevantes Ergebnis oben rankt und einen Score < 0,5 hat, stimmt gewaltig etwas nicht, dann vlllt. doch Mail an mich. <o:p></o:p></p>
<p><strong>Negativ</strong>: Eindeutig irrelevante Ergebnisse – NICHT für niedrige Scores (<1) verwenden, diese fliegen in Zukunft ohnehin raus. <o:p></o:p></p>
<p><strong>Danke!</strong><o:p></o:p></p>
</div>
</div>
</blockquote>
</div>
</div>
</body>
</html>