統計フィルタの詳細オプション
- (デフォルト値は40%)。スパムかどうかを判断するために新しい単語に割り当てられるパーセンテージ。0 から 100% までの値を入力してください。
値が大きいほど、電子メールメッセージに以前現れたかのように新しい単語が扱われる可能性が高くなります。値が小さいほど、電子メールメッセージに以前現れたかのように新しい単語が扱われる可能性が高くなります。例えば、0 を 入力した場合は、新しい単語がすべて非スパムとして扱われます。100% を入力した場合は、新しい単語がすべてスパムとして識別されます。
40% 以下に設定することをお勧めします。このオプションを 40% 前後に設定する理由は、正当な電子メールになる方を優先して統計分析を偏らせることによって、誤検知の可能性を減らすためです。
:例:このオプションを 20% に設定すると、新しい単語はスパム電子メールに 20% の率で、非スパム電子メールに 80% の率で現れたことがあると処理されます。 - (デフォルトは 90%)。 値が 100% に近いほど、スパムと判別される可能性は低くなります。値が 0 に近いほど、誤検知になる確率は高くなります。0 から 100% までの値を入力してください。
このオプションでは、メッセージがスパムとして識別される最小確率が設定されます。ここに入力した値よりも小さい確率値を持つメッセージは、 非スパムとして識別されます。この値よりも大きい確率値を持つメッセー ジは、スパムとして識別されます。
:このオプションを 80% に設定したと仮定します。電子メールメッセージが処理され、その内部のすべてのワード値の組み合わせ確率が 60% の場合、このメッセージは、確率ベンチマークである 80% を満たさないため、非スパムとして識別されます。
:「Stop」という単語がはじめて電子メールに出現した場合、それは新しい単語と見なされ、40% の確率 (新しい単語がスパムである確率) を割り当てられます。「スパムの計算された確率を超過」超過 を 90% に設定すると、「stop」はスパムと見なされません。「stop」がスパムと見なされるようにするには、その確率を 40% から 90% に増やす必要があります。 - (デフォルト値は 15)。電子メールがスパムである確率を計算するために使用される、各電子メー ル内の、個別の数。このテキストボックスに任意の値を入力できますが、25 を超える値は、予期しない結果をもたらす場合があります。
電子メール内部の各単語には 2 つのワード カウントが割り当てられます。単語がスパムに出現した回数と非スパムに出現した回数です。これらの値から、その単語のスパム確率が算出されます。この設定によって、平均的単語から確率が最も逸脱する単語を検査します。これらの単語はスパムと非スパムの両方の単語です。
:このオプションを 15 に設定したと仮定します。大部分の単語は 50% の平均スパム確率 (スパムの可能性 50%、非スパムの可能性 50%) を持つため、50% から最も遠い 15 の単語が使用されます。したがって、ある単語のスパム確率が 5% の場合は、それが使用されることになります。同様に、ある単語のスパム確率が 90% の場合も、それが使用されることになります。45% の確率を持つ単語が使用されることはほとんどありません。
の値は、統計フィルタリングの性能を左右します。値が大きいほど、メッセージ内で評価する単語を決める時間がかかります。したがって、統計フィルタリングは、電子メール確率の計算に時間がかかり、メール処理も時間がかかります。