ブログ

以下の記事はMedium上のDatafrens.sgの出版物から取られています。ChatGPT 4.0を使用して日本語に翻訳されました。

Article

ベルヌーイ分布は、かなりシンプルな分布です。もし、回答者が「はい」または「いいえ」という質問に答える場合、その回答はベルヌーイ分布に従うと言えます。ここで「a」を使っているのは、たった一つの回答を指しているからです。しかし、データサイエンティストはしばしば、「はいまたはいいえ」や「はいまたはいいえまたはたぶん」のような二値の結果の違いに混乱します。

あるイベントが二値の結果を持つと言うとき、それは「はい」を得る確率と、「いいえ」といった単一の代替を得る確率を指します。「たぶん」の場合、それが「はい」なのか「いいえ」なのかが不確定になります。私が述べた説明は、この分布を理解する上で非常に重要な役割を果たします。

実際の生活では、「はいまたはいいえ」だけではありません。人の性別に関しては、彼は男性であり、彼女は女性です。これは生殖器官に基づいており、第三の選択肢を期待していないので、二値的です。しかし、人の性別に関しては、全く異なる問題になります。定義上、性別とは男女の「社会的に構築された特性」を指します。個人の性別について尋ねるとき、それは生殖器官に基づいているため二値の結果が期待できます。しかし、個人の性別について尋ねると、それは一見二値であるように見えますが、ベルヌーイ分布を使って男性と非男性の性別の確率を説明することはできません。これは、生殖器官に基づいて男性である個人が、必ずしも性別として男性であるとは限らないため、他の選択肢が生じるからです。ベルヌーイ分布は、「はいまたはいいえ」というイベントを単純かつ厳密に説明するものです。他の選択肢は期待されていません。

この単一のイベントが置換を伴って繰り返されると、さらに複雑になります。置換とは何でしょうか?例えば、赤と緑のリンゴがいっぱい入ったバスケットから赤いリンゴを取り出し、その赤いリンゴをバスケットに戻して再び取り出す(先ほど取り出したリンゴが再び選択肢の一つとなる)行動が「置換を伴う」と呼ばれます。

関係性において、カップルは「結婚しているかしていないか」のいずれかですが、「結婚していない」という概念には独身者と離婚者が含まれ、「結婚している」は単に結婚している状態を指します。そして、ある人が再婚する場合、それは二項分布で説明される「置換を伴う」ケースでしょうか?技術的には正しいです。しかし、その人が再婚する前に「結婚していない」状態であったことを考えると、再び配偶者を探すとき、それは「置換を伴う」状態であり(ここで言う置換とは、潜在的な配偶者が再びその人を適格とみなすことを意味します)、しかしベルヌーイ分布では説明されず、したがって二項分布でも説明されません。「結婚しているかしていないか」という単純な問いが、アンケートの設計に深い影響を与えることに注目してください。回答の結果が真に、真に、そして真に二値であることを確認することが重要です。例えば、生殖器官に基づく「男性または女性」や、他の選択肢が全くない「はいまたはいいえ」などです。さらに重要なのは、「結婚していない」が独身者と付き合っている人の集合であり、付き合っている人は社会的には独身者と見なされることです。正の部分の逆の和は、正の全体の逆に加算されないかもしれませんが、正の部分は正の全体に加算されます。

(追記:「お気に入りのボードゲームの最初のラウンドで6を出しますか?」これについてどう思いますか?ベルヌーイ分布に該当するでしょうか?)

Comment are closed.