Skip to content

Commit

Permalink
Update 2024-11-29-貧乏企業名サジェスト機能開発.md
Browse files Browse the repository at this point in the history
  • Loading branch information
tubone24 authored Dec 3, 2024
1 parent a03f65f commit 8093cab
Showing 1 changed file with 6 additions and 1 deletion.
Original file line number Diff line number Diff line change
Expand Up @@ -483,7 +483,12 @@ ICU normalizerなどのプラグインのほか、独自で入れているChar f
それぞれのtokenizerの設定は次のとおりです。
ngramは、最小文字数2、最大文字数3で設定してます。これはあいまい検索のためにできるだけ単語を分割したほうが引っかかりやすいためです。
一方で、Edge ngramでは最大文字数を15まで拡大してます。これは前方一致の検索が次々と文章が打たれるたびに更新されていくためです。
一方で、Edge ngramでは最大文字数を15まで拡大してます。これは前方一致の検索が次々と文章が打たれるたびに検索が一致で絞り込まれるようにするためです。
| 入力テキスト | N-gram (n=2) | Edge N-gram (min=1, max=15) |
|------------|--------------|---------------------------|
| 株式会社 | 株式, 式会, 会社 | 株, 株式, 株式会, 株式会社 |
| テスト開発 | テス, スト, ト開, 開発 | テ, テス, テスト, テスト開, テスト開発 |
## インデックスの読み取り専用化
Expand Down

0 comments on commit 8093cab

Please sign in to comment.