リアルタイムで返信を管理する
- ユーザーの投稿を読み取り、その返信を非表示または再表示するための許可をユーザーに求めます。
- Account Activity API を使用して、受信した返信を検出します。
- Perspective API に「スコア」(0〜1 の数値)をリクエストします。これは、あるコメントが過去に見た有害なコメントにどの程度類似しているかについて、そのアルゴリズムの確信度を示す値です(Perspective はサービスに送信されたテキストを保存しません)。
- アルゴリズムのスコアが非常に高い場合に、hide replies を呼び出して返信を非表示にします。
透明性を心がける
- 最も望ましいのは、常にユーザーを信頼し、その判断を完全にユーザー自身がコントロールできるようにすることです。つまり、ユーザーエクスペリエンスには、App がユーザーの代わりに行ったあらゆる操作を取り消せるコントロールを含める必要があります。
- AI(人工知能)を利用する場合、App は投稿を検出して非表示にする際に、非常に高い信頼度のしきい値を使用する必要があります。
- すべての人が同じ言葉を使うわけではないため、App は偏りを避けるように設計する必要があります。誤検知につながる可能性のある、スラングや、当事者が肯定的な意味で使い直している言葉には注意してください。
- AI を学習させる場合は、X 上で頻繁に使われる言葉遣いをできるだけ忠実に反映したモデルの採用を検討してください。