- 1 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:39:04.52 ID:v8Db7tU6d
-
「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに
「日本の住所のヤバさ」が6月7日朝にTwitterトレンドになっている。住所表記の正規化・名寄せがいかに難しいかを解説した、inuroさんのnote記事「とにかく日本の住所のヤバさをもっと知るべきだと思います」がバズっているためだ。
6月4日のテレビ番組で、マイナンバーカードに記載される住所をめぐり、河野太郎デジタル大臣が「将来的にはAIの技術を使って住所の表記揺れを判断することがあり得るかもしれない」と発言し、住所の正規化についてネットで議論になっていたことがきっかけだ。
記事は、「日本の住所システムがカオスで、その計算機的な処理がいかに困難か」を解説する内容だ。
まず、日本にはそもそも、新旧の2つの住所システム(A町1丁目3番2号/A町1234番地)が併存しており、例えば、「浦安市舞浜2」の住所が「舞浜2丁目」「舞浜2番地」の2系統あるケースを紹介。
さらに、まったく同じ住所表記が異なる複数の建物に付与されているケースや、表記を勘違いして入力するユーザーがいること(「八街市」(やちまたし)を「8街市」にする)――など、住所正規化・名寄せに立ちはだかる多くのハードルを解説している。
読者からは「確かに大変だ」「想像以上のヤバさ」「無理ゲー」などの感想が届いている。
また、位置情報サービスを提供するGeoloniaの宮内隆行CEOが2020年にQiitaに書いた記事「日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。」をirunoさんは紹介し、「ぜひそちらもご覧になってください」と案内している。
https://news.yahoo.co.jp/articles/b179547f31a96d2469198e5872859bb221aeb4f7 - 2 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:39:52.33 ID:IGHJhYKP0
-
自民党というか日本政府の管理能力の欠如の現れみたいなもんだなこれ
- 3 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:40:57.91 ID:zIT9dmkaM
-
新潟市北区の東栄町はどちらかが改名されることになりそうだな
- 4 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:41:01.31 ID:v8Db7tU6d
-
とにかく日本の住所のヤバさをもっと知るべきだと思います
「住所の揺らぎ程度のことにAIを使いたいだとかデジタル音痴」だの「住所の正規化なんてExcelで2時間あれば作れそう」だの、たいへんフットワークの軽やかな言説の数々に、位置情報界隈のみならず住所の正規化や名寄せに少しでも関わったことのあるエンジニアが総立ちでマサカリを投げていたのも記憶に新しい今日この頃ですが(2023年6月6日)、この手の騒動は周期的に起こってる印象です。
ということはつまり・いつまで経っても解消されない、解決が困難な課題である
・その困難さが界隈以外に共有されていないであるわけで、その都度Twitterにトリビアが投下されてはTLが賑わい華やかではありますが、そろそろ自分の整理としてもどれだけ日本の住所システムがカオスで、その計算機的な処理がいかに困難かをメモっておこうかと思いました。
・そもそも住所システムが二つ併存している
住所と聞くと「XX町1丁目3番2号」みたいなのをまず思い浮かべると思いますが、これは「住居表示」という比較的新しいシステムで、以下の国土地理院のページの説明にあるように街区で分けてそこの建物に番号を振ろうというものです。分かりやすいですね。ところがこのシステムは全国で均質に導入されているわけではなく、実施については各市町村に任されており、市町村単位はもちろん、同じ自治体の中でも実施済みの地域と未実施の地域が混在していたりします。じゃあ未実施の地域はどうしているかというと、「XX町1234番地」といった具合に、土地についた番号=地番を元に住所が付与されています。
さらにややこしいことに、地番システムを使ったまま番号だけ分かりやすく住居表示のような形に再整理するという地番整理というものもあります。以下は町田市の例ですが、ピンクの所が住居表示実施済み、黄色が次回実施予定、青は地番整理済み、白は従来通りの地番制です。森野6丁目に注目。1~5丁目は住居表示なのに6丁目だけ未実施なんですね。
https://www.city.machida.tokyo.jp/kurashi/sumai/toshikei/t_06/zyuusyiseirizigyounituite.htmlこれの何が厄介かというと、いやいろいろ厄介なんですが、例えばハイフンを使った省略記法で書かれたとき住所を特定するのが困難になる場合があります。
- 5 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:41:08.07 ID:27ZbOmBJ0
-
今はどうやって荷物とか届いてるの?
- 33 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:47:36.42 ID:yjjgq6/A0
-
>>5
配達の人が手で持ってくるよ(欠損で頭に乗せてくる奴とかは除く) - 6 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:41:29.93 ID:Idt0SoBI0
-
日本の行政、日本の役人がいかに無能かよくわかる事例
ほんとこの国は一度ガラガラポンしないとどうにもならん - 7 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:41:37.93 ID:RwAnGJMB0
-
しかも同じ番地で建物が3つぐらいあるの
外回りはゼンリンの住宅地図必須やな
- 8 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:41:53.33 ID:cnXZuMr+a
-
自動配達のこと考えたらもっとわかりやすいほうがいいんだろうな
- 9 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:41:56.44 ID:v8Db7tU6d
-
印象的な例として、東京ディズニーランドのある浦安市舞浜を挙げましょう。ここで、舞浜小学校の住所は「浦安市舞浜2-1-1」ですが、これは住居表示実施地域であり、舞浜2丁目1番1号を表します。
https://www.city-urayasu.ed.jp/maiha-es/一方で、ディズニーアンバサダーホテルの住所は「浦安市舞浜2-11」ですが、これは舞浜2丁目ではありません。住居表示が実施されていない「舞浜」の、2番地11を指しています。首都高湾岸線を挟んで北と南、場所ももちろん違います。
https://www.olc.co.jp/ja/tdr/profile/ambassador.html
このように、同じ舞浜2-**と書かれていても、地域が違うのです。統一しろや!と思いませんでしたか?思いましたね。僕も思っています。
- 10 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:42:27.92 ID:dVmeSzSi0
-
誇らしい
- 11 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:42:38.70 ID:v8Db7tU6d
-
丁目は必ず町大字の下にあるとは限らない
1丁目とか2丁目は、何となく「○○市XX町1丁目」みたいなパターンだと思ってませんか?実際それが大多数なんですが、中には市区町村の下にそのまま丁目が着くところもあります。
例えば下田郵便局の住所は「静岡県下田市2丁目4-26」です。下田市の直下にいきなり2丁目が来ています。「市区町村と*丁目の間には必ず何か文字がある」みたいなパーサーの実装を書いてハマる部分です。https://www.post.japanpost.jp/cgi-shiten_search/shiten.php?id=10296
下田市には1丁目から6丁目までありますが、埼玉県春日部市にも八丁目があります。しかし八丁目しかありません。こういう場合、八は序数ではなく固有名詞の一部として受け止められている場合もあります。現に八丁目の店舗や施設で、住所を「春日部市8-353」などと書いているところは目にしないように思います。こういう場合、住所を表示する際に「**丁目はアラビア数字+丁目に統一して」なんていう処理を書くとこれまたハマるわけです。
- 13 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:42:51.06 ID:acVyejziM
-
「日本の公務員が無能で仕事してない」というシンプルな話
- 14 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:43:32.19 ID:W7z3ppcG0
-
●●郡とかもヤバい
- 28 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:46:47.44 ID:S2iyEejl0
-
>>14
市町村合併で公式には使えない自治体が多いのに郵便なんかでは併記扱いで未だに使える奴があるんだっけ? - 15 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:43:42.71 ID:JnbMNQHQp
-
東新町か
- 16 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:44:31.33 ID:zYgELnZy0
-
府の市の町
市の区の丁
これが原因だろ - 30 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:47:24.96 ID:zYgELnZy0
-
>>16
大阪府 大阪市
京都府 京都市もっと田舎になるもっとややこしい
- 17 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:44:32.06 ID:BXtjpdRP0
-
その場しのぎ問題先送りのクソアホ国家
- 18 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:45:07.15 ID:nqACCvS70
-
「困るのは俺じゃないから笑」をやり続けた結果
- 19 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:45:10.05 ID:QJAlL7Ogd
-
実務上なんかもんだいあるの?
丸写しすりゃ届くしロが口になっててもその土地の配達員は間違わないんじゃ - 20 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:45:14.75 ID:v8Db7tU6d
-
丁目どころか町大字すらあるとは限らない
番地とか号は「○○市XX町1丁目2番地3号」みたいなパターンだと思っていませんか?実際それが(中略)ですが、例えば以下は奈良県の御所市役所のウェブサイトです。住所が「奈良県御所市1番地の3」ですね。市の下にいきなり番地がついています。檜原村など人口の少ない山村では見られる例ですが、市レベルの自治体では珍しいです。
・街区符号や番地は数字とは限らない
1-2だの1024だのばかり想定していると真っ先にハマる部分であり、ジオコーダー/住所正規化あるあるLV1といった感があります。が、その内容は多岐に渡り、正直ルールベースで全部を網羅できるとはちょっと思えません。例えば先の宮内さんのエントリにもあった大阪市中央区などは、「ABC」が正式に街区符号として採用されています。例えば水資源機構の関西吉野川支社の住所は大阪市中央区上町A-12です( https://www.water.go.jp/kansai/kansai/ )。
https://saigai.gsi.go.jp/jusho/view/pref/city/27128.html
また、同じ大阪だと中央区久太郎町四丁目には「渡辺」という街区符号があることもその筋では有名ですね。
また、千葉県では番地の前に「いろは」で字が振られている所があります。
歴史的経緯としても興味深いんですが、住所を処理する側としては厄介です。「数字ではない」のもそうなんですが、特に「ろ」と「は」は、カタカナで表記された場合けっこうな確率で「口」と「八」が混ざり込んできます。八街北小学校の住所は「千葉県八街市八街は18番地2」ですが、これが「千葉県八街市八街八18-2」と入力されたときの絶望を想像してみてほしいです。
他にも石川県にはイロハだけでなく「甲乙丙」「子丑寅卯」「仁義礼智信」という地名があったりします。
- 21 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:45:19.93 ID:/WIMsy5G0
-
イギリスみたいにコード振ったらええんちゃうか?
- 22 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:45:29.36 ID:avf1cKcqa
-
何でこんなにきったない割り当てになったのだろう
区域も変だし - 23 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:45:34.29 ID:effinWoV0
-
これは本当にそう
海外見習って欲しいけど今更住所変更するのもめちゃくちゃ大変だよな - 24 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:45:52.88 ID:VKeBv+rD0
-
どこの国でも似たようなもんじゃね
- 25 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:45:54.21 ID:C/bn89Pkd
-
ゆうちょ銀行のために様式細かくなってるのもなんとかしてくれ
まあ原因は他銀行側なんだけど - 26 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:45:57.95 ID:v8Db7tU6d
-
都道府県名や市区町村名が住所中に出てくるのは一回だけとは限らない
住所を処理しようとして「市」「村」といった接尾語で分割しようというのは王道の失敗ルートなわけですが、そこを抜けたあと「そうだ!都道府県名は確か日本全国でユニークだからまずそれを抽出・除去すれば効率的やろ」とか次に考えます。が、これもストレートには上手くいきません。
例えば、長野県庁のある長野市南長野で、県庁のすぐ北東斜向かいは「県町」という町域です。これを素直に書くと「長野県長野市南長野県町」となり、「長野県」が二回も登場します。そもそも長野がインフレしていて目が滑ります。
暮らしてる方々も不便を感じているのか、実際には大字の南長野を省略して「長野県長野市県町」と書かれることが多いようです。ですが、中には以下のようにそのまま書かれている例もあり、もし都道府県名を取り除く処理を書いていたりするとこれが「長野市南町477-1」になってしまったりするわけです。恐ろしいですね。
- 27 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:46:05.97 ID:wW3H+koKa
-
郵便局に名寄せ辞書ゆずってもらえば
- 29 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:46:51.31 ID:v8Db7tU6d
-
住居表示の住所がユニークとは限らない
こういう数々のカオスを、(相対的に)新しい住所システムである住居表示が解決するのだと期待されているんですが、住居表示は住居表示で実施は各自治体任せであり、そこには運用のバラつきが悲しいことに生じています。
例えば、スパゲッティーのパンチョ渋谷店の住所は「渋谷区道玄坂2-6-2」ですが、
https://naporitanpancho.com/shibuya
そのすぐ近くにある渋谷げんかつの住所も「渋谷区道玄坂2-6-2」です。
https://twitter.com/genkatsu315
これらは、街区符号も住居番号も同じですが、それぞれ藤山恒産道玄坂ビル、美奈津ビル、と別々のビルに入居しています。つまり全く同じ住所が複数のビルに付与されているわけです。
こういう場合、例えば枝番を付けて「2-6-2-1」「2-6-2-2」と区別することを期待しますし、実際にそう運用している自治体もあります。しかし、あくまでそれぞれの自治体任せであるため、渋谷区では重複上等・ビル名で区別できるでしょという運用になっています(渋谷区役所に行って担当の方に直接確認してきました)。ビル名まで含めないと住所がユニークにならないわけで、もし店舗データベースを構築しているとして、番地号レベルの住所に丸めて寄せてしまうと、違うビルの店舗が一箇所にまとまってしまうことになります。恐ろしいですね。
- 31 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:47:29.30 ID:/4Jd+Fx/r
-
狭小地でもないのに隣と同じ住所だわ
Google Mapだとうちにピンが刺さるから出前が間違えてうちに届く - 32 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:47:33.20 ID:99Aut6Eb0
-
八街を8街と書くのは流石に障碍者だけでは?
- 34 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:47:36.81 ID:UQv6USg60
-
それとこれとは別問題だろ
住所ヤバいからって郵便物はちゃんと届いてるから郵便局は
それでやれてるわけじゃん - 43 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:50:22.40 ID:zYgELnZy0
-
>>34
住所は被ってる地域はあるから
配達も間違える人はいる - 35 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:47:45.75 ID:SONOelPb0
-
ジャップに管理は無理
白人様にやってもらえ - 36 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:48:07.93 ID:kTgP+i3s0
-
住居表示を実施している地区では地番表示は使わねえよ普通
- 37 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:49:05.20 ID:hFdRJ2ig0
-
まぁマジにネトウヨは馬鹿だからなw
- 38 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:49:09.09 ID:v8Db7tU6d
-
正しい文字が使われるとは限らない
さて、これだけ様々な例外を全部潰してブリリアントなシステムを構築したとしても、最大の障壁は「人間は正しく住所を入力してくれるとは限らない」という点にあります。前出の千葉県八街市が良い例で、「は」を「ハ」とカタカナで書いたのを「8」と読み間違えて、「八」が入力されることは決して低い確率ではありません。
また、同じ千葉県で、香取市役所の住所は「千葉県香取市佐原ロ2127」ですが、僕も初見はこれ「さわらぐち」と読んでいました。正解は「さわら ろ」です。必然的に「佐原口」という入力が極めて頻繁に降ってきます。自分で書いててもどっちがどっちか分からなくなります。
https://www.city.katori.lg.jp/smph/sightseeing/machinami/index.html
この手の文字の混在でダントツでカオスなのはハイフンで、ありとあらゆるパターンの「ハイフンみたいな文字」が使われます。ハイフンとマイナスは違うのかー、ダッシュも別の概念なんだな、などと勉強になること甚だしいですが、それにしたって罫線はないだろがよ、もはや言語ですらねえぞとキレても許されると思います。
- 39 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:49:35.76 ID:BkfnBXXw0
-
区画整理してる土地は役所が持ってるデータにばらつきがあってどれが本当なのか分からないぐらいグチャグチャになってることも
- 40 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:49:59.85 ID:aHGiqDyi0
-
隙あらばホルホル
ただ単に無秩序なだけだよね - 41 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:50:12.36 ID:Lei/ONdX0
-
登記に書いてある地番といわゆる住所はけっこうと言うかかなり違うとは聞いた
- 42 名前:一般よりも上級の名無しさん 投稿日時:2023/06/07(水) 10:50:19.29 ID:RwAnGJMB0
-
Google様のplus codeを使わせてもらおうぜw
建物だけじゃなくて、例えばこれからの時期花火大会にピザデリバリーとかも依頼できるし
コメント一覧