fastKnn

fastknn

Beschreibung

Führt eine Suche nach den k-nächsten Nachbarn durch. Diese Aktion identifiziert die k nächsten Nachbarn für jede Beobachtung in einer Abfragetabelle basierend auf den Daten in einer Referenztabelle.

Einstellungen
ParameterBeschreibung
attributesGibt die Variablenattribute an.
displayGibt eine Liste von Ergebnistabellen an, die zur Anzeige an den Client gesendet werden sollen.
distanceMetricGibt die Metrik an, die zur Messung des Abstands zwischen Punkten in k-Nächste-Nachbarn-Berechnungen verwendet werden soll (L2, COSINE, IP).
efConstructionGibt die Anzahl der Nachbarn an, die während der Graphenkonstruktion berücksichtigt werden sollen.
efSearchGibt die Anzahl der Kandidatenknoten an, die während der Graphensuchphase untersucht werden sollen.
idGibt die Variable an, die als Datensatzidentifikator verwendet werden soll.
imputeWenn auf True gesetzt, werden fehlende Werte in der Abfragedatentabelle mithilfe der k-Nächste-Nachbarn-Methode imputiert.
inputsGibt die Variablen an, die in der Analyse verwendet werden sollen.
kGibt die Anzahl der zurückzugebenden Nachbarn an.
maxNeighborsGibt die maximale Anzahl von Verbindungen an, die jeder Knoten zu anderen Knoten innerhalb einer Schicht haben kann.
methodGibt die zu verwendende k-Nächste-Nachbarn-Suchmethode an (APPROXIMATE oder EXACT).
outDistGibt die Ausgabedatentabelle an, in der die berechneten Abstände gespeichert werden sollen.
outImputeGibt die Ausgabedatentabelle an, in der die Abfragedaten nach der Imputation fehlender Werte gespeichert werden sollen.
outputGibt die Ausgabedatentabelle an, in der die berechneten Nachbarn gespeichert werden sollen.
outputTablesListet die Namen der Ergebnistabellen auf, die als CAS-Tabellen auf dem Server gespeichert werden sollen.
queryGibt die Eingabedatentabelle für die Abfrage an, die die Abfragebeobachtungen enthält.
seedGibt den Startwert für die Zufallszahlengenerierung an.
tableGibt die Einstellungen für eine Eingabetabelle an (die Referenzdaten).
threshDistGibt den Schwellenwert an, der für die Abstandsberechnung verwendet werden soll.
useTopKOutDistWenn auf True gesetzt, werden nur die Top-k-nächsten Abstände in die Parametertabelle outDist ausgegeben.
Daten erstellen

Erstellen Sie einen einfachen Datensatz für das KNN-Beispiel.

Kopiert!
1DATA mycas.source_data;
2 INPUT id x1 x2;
3 DATALINES;
4 1 1 1
5 2 1 2
6 3 2 1
7 4 5 5
8 5 5 6
9 6 6 5
10 ;
11RUN;
12 
13DATA mycas.query_data;
14 INPUT qid x1 x2;
15 DATALINES;
16 1 1.1 1.1
17 2 5.1 5.1
18 ;
19RUN;

Beispiele

Sucht die 2 nächsten Nachbarn für jeden Abfragepunkt.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 fastKnn.fastknn /
3 TABLE={name="source_data"}
4 query={name="query_data"}
5 k=2
6 id={"id"}
7 inputs={"x1", "x2"}
8 OUTPUT={casOut={name="knn_results", replace=TRUE}};
9RUN;
Ergebnis :
Eine Ausgabetable 'knn_results', die die IDs der 2 nächsten Nachbarn und deren Abstände für jeden Punkt in 'query_data' enthält.

Führt eine Suche mit 3 Nachbarn durch, verwendet die L2-Distanz und speichert die berechneten Abstände in einer separaten Tabelle.

SAS® / CAS-Code Code wartet auf Validierung durch die Community
Kopiert!
1PROC CAS;
2 fastKnn.fastknn /
3 TABLE={name="source_data"}
4 query={name="query_data"}
5 k=3
6 distanceMetric="L2"
7 id={"id"}
8 inputs={"x1", "x2"}
9 outDist={name="distances", replace=TRUE}
10 OUTPUT={casOut={name="knn_detailed", replace=TRUE}};
11RUN;
Ergebnis :
Zwei Ausgabetabellen: 'knn_detailed' mit den Nachbarn und 'distances' mit den detaillierten Abstandswerten.

FAQ

Was ist die Hauptfunktion der Aktion fastknn?
Welche Suchmethoden werden von der Aktion unterstützt?
Welche Metriken stehen für die Distanzberechnung zur Verfügung?
Wie viele Nachbarn werden standardmäßig zurückgegeben?
Kann die Aktion fehlende Werte in den Daten behandeln?
Welche Eingabetabellen sind für die Ausführung erforderlich?