<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
    <channel>
        <title>アメリカ - Tag - wasuの雑記</title>
        <link>https://blog.wasutech.dev/tags/%E3%82%A2%E3%83%A1%E3%83%AA%E3%82%AB/</link>
        <description>アメリカ - Tag - wasuの雑記</description>
        <generator>Hugo -- gohugo.io</generator><language>jp</language><lastBuildDate>Sun, 14 Jun 2026 20:00:00 &#43;0900</lastBuildDate><atom:link href="https://blog.wasutech.dev/tags/%E3%82%A2%E3%83%A1%E3%83%AA%E3%82%AB/" rel="self" type="application/rss+xml" /><item>
    <title>アメリカが統計データのノイズを禁止した話</title>
    <link>https://blog.wasutech.dev/posts/%E3%82%A2%E3%83%A1%E3%83%AA%E3%82%AB_%E7%B5%B1%E8%A8%88%E6%83%85%E5%A0%B1%E3%81%AB%E3%83%8E%E3%82%A4%E3%82%BA%E3%82%92%E3%81%84%E3%82%8C%E3%82%8B%E3%81%93%E3%81%A8%E3%82%92%E7%A6%81%E6%AD%A2%E3%81%AB%E3%81%99%E3%82%8B/</link>
    <pubDate>Sun, 14 Jun 2026 20:00:00 &#43;0900</pubDate>
    <author>wasu</author>
    <guid>https://blog.wasutech.dev/posts/%E3%82%A2%E3%83%A1%E3%83%AA%E3%82%AB_%E7%B5%B1%E8%A8%88%E6%83%85%E5%A0%B1%E3%81%AB%E3%83%8E%E3%82%A4%E3%82%BA%E3%82%92%E3%81%84%E3%82%8C%E3%82%8B%E3%81%93%E3%81%A8%E3%82%92%E7%A6%81%E6%AD%A2%E3%81%AB%E3%81%99%E3%82%8B/</guid>
    <description><![CDATA[<p>トランプ政権がやらかした話。</p>
<h2 id="何が起きたか">何が起きたか</h2>
<p>米国商務省が「ノイズ注入（noise infusion）を Census Bureau と BEA の統計製品で全面禁止」する命令を出した。</p>
<p>Census Bureau（国勢調査局）は日本でいう総務省統計局みたいなもので、アメリカの人口・世帯・住居などを調査して公開する機関。10年に1回の国勢調査を担当していて、選挙区の区割りや連邦予算の配分にも使われる重要なデータを出している。</p>
<p>BEA（Bureau of Economic Analysis、経済分析局）はGDPや個人消費などの経済統計を出す機関。日本でいう内閣府の国民経済計算に近い。</p>
<p>どちらもアメリカの政策立案の根拠になる統計を扱っていて、研究者や行政が広く使っている。</p>
<p>参考：<a href="https://desfontain.es/blog/banning-noise.html" target="_blank" rel="noopener noreffer ">Banning noise will be a disaster for statistical data products</a></p>
<h2 id="ノイズって何">ノイズって何</h2>
<p>国勢調査みたいな統計データを公開するとき、個人が特定されないよう数値にわざと誤差を混ぜるテクニック。Differential Privacy（差分プライバシー）の中核手法。</p>
<p>具体例で説明する。</p>
<p>人口3人の離島「ホゲ島」があるとする。国勢調査で以下のような統計が公開されたとしよう。</p>
<div class="code-block code-line-numbers open" style="counter-reset: code-block 0">
    <div class="code-header language-">
        <span class="code-title"><i class="arrow fas fa-angle-right" aria-hidden="true"></i></span>
        <span class="ellipses"><i class="fas fa-ellipsis-h" aria-hidden="true"></i></span>
        <span class="copy" title="Copy to clipboard"><i class="far fa-copy" aria-hidden="true"></i></span>
    </div><pre tabindex="0"><code>ホゲ島の30代男性：3人
ホゲ島の既婚男性：2人
ホゲ島の会社員男性：3人
ホゲ島の持ち家あり男性：1人
...</code></pre></div>
<p>この数値が全部正確だと、組み合わせることで「ホゲ島に住む30代・既婚・会社員・持ち家なしの男性は2人」みたいな情報が芋づる式に確定していく。統計を大量に突き合わせると連立方程式になって、最終的に「この人物は山田さんしかいない」まで絞り込めてしまう。</p>
<p>ノイズを入れると話が変わる。</p>
<div class="code-block code-line-numbers open" style="counter-reset: code-block 0">
    <div class="code-header language-">
        <span class="code-title"><i class="arrow fas fa-angle-right" aria-hidden="true"></i></span>
        <span class="ellipses"><i class="fas fa-ellipsis-h" aria-hidden="true"></i></span>
        <span class="copy" title="Copy to clipboard"><i class="far fa-copy" aria-hidden="true"></i></span>
    </div><pre tabindex="0"><code>ホゲ島の30代男性：5人（真値は3人）
ホゲ島の既婚男性：1人（真値は2人）
ホゲ島の会社員男性：4人（真値は3人）
...</code></pre></div>
<p>全部の数値に誤差が乗っているので、連立方程式を立てても解が一意に定まらない。「だいたい3人くらいいる」という傾向は読み取れるが、個人の特定には使えない。これがノイズの効果。</p>]]></description>
</item>
</channel>
</rss>
