Project LINKS(以下、LINKS)では、国土交通分野の行政情報を機械処理・二次利用可能なデータに加工・編集する際に、本ポリシーに定める処理を実施します。本ポリシーの詳細は「オープンデータ化ガイドライン」をご確認ください。
秘匿化には大きく分けて3つの種類があります。
LINKSでは、後述のとおり3の秘匿化方法から適切な方法を選択しています。
個人情報であり、個人情報の利用目的内と判断される場合
個人情報であり、個人情報の利用目的外と判断される場合
個人情報ではないが法人等の権利利益を侵害するおそれがある場合など
個人情報や法人等の権利利益に関わる情報を含むデータを適切にオープンデータ化するための手法には、様々な種類があります。
LINKSでは、下表に示す手法から適切な秘匿化処理を選択しています。
※下表は、匿名加工情報の作成に当たっての一般的な加工手法を例示したものであり、その他の手法を用いて適切に加工することを妨げるものではありません。
手法名・解説 [1] | 処理例 [2][3] | ||
---|---|---|---|
処理前 | 処理後 | ||
項目削除/レコード削除/セル削除 | 加工対象となる個人情報ファイルに含まれる保有個人情報の記述等を削除するもの。 | 個人の氏名:国土 太郎 個人の連絡先:090-〇〇〇-△△△△ | 氏名・連絡先を削除 |
一般化 | 加工対象となる情報に含まれる記述等について、上位概念若しくは数値に置き換えること又は数値を四捨五入などして丸めることとするもの。 | 法人(個人)の住所、製造施設の住所、設備等の保管地:〇〇県〇〇市〇〇丁〇〇番〇〇号 | 〇〇県 |
営業所の所在地:〇〇県〇〇市〇〇町〇番〇号 | 経度・緯度 | ||
特定の年齢:19歳、27歳、35歳、48歳 | 1:20代未満、2:20代、3:30代、4:40代 | ||
特定の経歴:3年、8年、12年、20年 | 1:1-5年、2:6-10年、3:11-15年、4:16-20年 | ||
トップ(ボトム)コーディング | 加工対象となる個人情報ファイルに含まれる数値に対して、特に大きい又は小さい数値をまとめることとするもの。 | 特定の年度:1982年、1994年、2003年 | 1980年:1980年~1999年 2000年:2000年~2019年 |
ミクロアグリゲーション | 加工対象となる個人情報ファイルを構成する保有個人情報をグループ化した後、グループの代表的な記述等に置き換えることとするもの。 | 特定の数量:3台、5台、26台、38台、42台 | 1:1以上5台未満、2:5以上20台未満、3:20以上50台未満 |
特定の数量:在庫数 | 各階層データ数が全データ数に対して10%となるように整理 | ||
データ交換(スワップ) | 加工対象となる個人情報ファイルを構成する保有個人情報相互に含まれる記述等を(確率的に)入れ替えることとするもの。 | 1982年、国土 太郎 1994年、国土 花子 2003年、国土 次郎 | 1994年、国土 次郎 2003年、国土 太郎 1982年、国土 花子 |
ノイズ(誤差)付加 | 一定の分布に従った乱数的な数値を付加することにより、他の任意の数値へと置き換えることとするもの。 | 資本金: 300万円~500万円 24社 500万円~1000万円 18社 1000万円~2000万円 31社 2000万~ 27社 合計 100社 | 資本金: 300万円~500万円 36社 500万円~1000万円 22社 1000万円~2000万円 19社 2000万~ 23社 合計 100社 |
疑似データ生成 | 人工的な合成データを作成し、これを加工対象となる個人情報ファイルに含ませることとするもの。 | ||
その他(新規IDの再附番)[3] | 既存の番号やID等を新たな附番ルールに基づき新規ID等に再附番するもの。 | 特定のID:D239508FE | 新規ID:9203451 |
その他(偏差値化)[3] | 元のデータの値を平均値と標準偏差を用いて変換するもの。 | 特定の数量:1、2、58、89、101、131,201 | 1~100までは実数、101以上は「999」 |
行政機関等匿名加工情報[5]とは、保有個人情報の全部又は一部を加工して得られる匿名加工情報のことです。
LINKSでは、個人情報保護の権利利益保護に配慮しつつ、データの有用性を保つための適切な匿名化処理を行っています。個人情報保護委員会規則で定める基準に従い匿名化を行い、個人情報のどの項目を削除または一般化するか等を検討しています。
統計情報[6]の作成においては、個人の特定リスクを排除しつつ、データの持つ本質的な情報価値を最大限保持するバランスが重要となります。
LINKSでは、統計処理の方法論を明確にすることで、データの信頼性と透明性を確保しています。
統計処理の妥当性…個人を特定できる情報(氏名、住所等)について、削除または統計処理を行う
統計区分の粒度…地理的区分(都道府県、市区町村、町丁目など)、年齢区分、所得区分、時間区分等を適切に設定する
統計処理…前項の統計化の必要性と方法を検討する
<参照元資料>
[1] 個人情報保護委員会事務局「個人情報の保護に関する法律についての事務対応ガイド(行政機関等向け)」, 令和4年2月(令和6年4月一部改正), p.352 (参照 2025年4月)