계산 C #을 TFIDF 벡터 알고리즘을 소스 코드의 텍스트를 작성하는 데 사용, 텍스트, 소스의 전체 소스 코드에 대한 코사인 유사 거리 계산 알고리즘을 사용하는 등, 한동안 테스트되었습니다.
File list:
TFIDF
....\TFIDF
....\.....\bin
....\.....\...\Debug
....\.....\...\.....\TFIDF.exe
....\.....\...\.....\TFIDF.pdb
....\.....\...\.....\TFIDF.vshost.exe
....\.....\...\.....\TFIDF.vshost.exe.manifest
....\.....\obj
....\.....\...\Debug
....\.....\...\.....\TempPE
....\.....\...\.....\TFIDF.csproj.FileListAbsolute.txt
....\.....\...\.....\TFIDF.exe
....\.....\...\.....\TFIDF.pdb
....\.....\Properties
....\.....\..........\AssemblyInfo.cs
....\.....\Program.cs
....\.....\TFIDF.cs
....\.....\TFIDF.csproj
....\TFIDF.sln
....\TFIDF.suo