🚛Stripe Connectでアカウントを作成する際の住所の正規化に、GeoloniaのOSSライブラリで挑んでみる2021/12/29に公開2021/12/304件JavaScriptStripetechDiscussion宮内@geolonia2021/12/30に更新弊社のnormalize-japanese-addressesを試していただいてありがとうございます! 丁目がtownに漢数字で入っていることなどは気になります。 これにつきましては、たとえば岩手県の花巻市には「十二丁目」という地名があります。どういうことかというと、ここには十一丁目とか十三丁目があるわけではなく、他の町名に混ざって十二丁目だけがぽつんとある感じです。 https://geolonia.github.io/japanese-addresses/api/ja/岩手県/花巻市.json このケースの場合12丁目としてしまうことは一郎を1郎と書くことになってしまうため、アラビア数字か漢数字に統一するなら、漢数字のほうが誤りではないという意味で、このライブラリでは漢数字に統一しています。(ちなみに万丁目という地名もあります。笑) 一応弊社では別のライブラリでアラビア数字<=>漢数字の相互変換をするライブラリも用意しておりますが、上述のような問題がありますので、現状ではアラビア数字に変換することはとても困難ですが、デジタル庁によるベースレジストリが整備されれば、このあたりの精度が劇的に改善されると思います。(あと数年かかるかもですが。。。) https://github.com/geolonia/japanese-numeral 京都市の通り名 京都市の通り名については、それがなくても郵送等では実害がないと弊社では判断しておりまして、弊社の不動産共通IDでも同様の仕様になっており、「置き配」ですでに利用されています。 hidetaka okamoto2021/12/30コメントありがとうございます! 「Stripe ConnectとそのAPIが要求する仕様に、このライブラリ +αでどこまで対応できるか。」を試す意図でしたので、ライブラリ側の挙動が気になるような書き方になっていてすみません。(「Connect向けに使う上では」を先ほど追記しました) 丁目の漢数字表記 Connect側の要求がアラビア数字なだけで、一般的には漢数字が標準なのかなと思っていましたが、 花巻市のようなケースがあるからなんですね。そして万丁目を10000丁目にするのもかなり厳しそうですね・・・ japanese-numeralライブラリも試したのですが、「X丁目」部分だけを抜き出す正規表現に手こずって断念しました・・・ 漢数字でConnectのAPIに投げてみて、一応処理はされた様子でしたので、元記事ではアラビア数字指定でしたが、記事内では漢数字のまま投げるようにしています。 京都の通り名 住んでいた時にもよく省略していましたので、個人的には省略したままでいいのではと思っている派です。 役所とかで書く時、絶対に入力欄が足りなくなるんですよね・・・・ ただ、元記事の例外項目に上がっていましたので、「この記事のサンプルでは省略されます」と伝える意味で言及することにしました。 Connectでは本人確認フェーズがありますので、そこで必要になるかもしれず、来年もう少し掘り下げて調べてみるようにします。 返信を追加宮内@geolonia2021/12/30ちなみに Geoloania ではなくて Geolonia です。笑 hidetaka okamoto2021/12/30ほんとすみません・・・ 先ほど修正かけました。 返信を追加
宮内@geolonia2021/12/30に更新弊社のnormalize-japanese-addressesを試していただいてありがとうございます! 丁目がtownに漢数字で入っていることなどは気になります。 これにつきましては、たとえば岩手県の花巻市には「十二丁目」という地名があります。どういうことかというと、ここには十一丁目とか十三丁目があるわけではなく、他の町名に混ざって十二丁目だけがぽつんとある感じです。 https://geolonia.github.io/japanese-addresses/api/ja/岩手県/花巻市.json このケースの場合12丁目としてしまうことは一郎を1郎と書くことになってしまうため、アラビア数字か漢数字に統一するなら、漢数字のほうが誤りではないという意味で、このライブラリでは漢数字に統一しています。(ちなみに万丁目という地名もあります。笑) 一応弊社では別のライブラリでアラビア数字<=>漢数字の相互変換をするライブラリも用意しておりますが、上述のような問題がありますので、現状ではアラビア数字に変換することはとても困難ですが、デジタル庁によるベースレジストリが整備されれば、このあたりの精度が劇的に改善されると思います。(あと数年かかるかもですが。。。) https://github.com/geolonia/japanese-numeral 京都市の通り名 京都市の通り名については、それがなくても郵送等では実害がないと弊社では判断しておりまして、弊社の不動産共通IDでも同様の仕様になっており、「置き配」ですでに利用されています。 hidetaka okamoto2021/12/30コメントありがとうございます! 「Stripe ConnectとそのAPIが要求する仕様に、このライブラリ +αでどこまで対応できるか。」を試す意図でしたので、ライブラリ側の挙動が気になるような書き方になっていてすみません。(「Connect向けに使う上では」を先ほど追記しました) 丁目の漢数字表記 Connect側の要求がアラビア数字なだけで、一般的には漢数字が標準なのかなと思っていましたが、 花巻市のようなケースがあるからなんですね。そして万丁目を10000丁目にするのもかなり厳しそうですね・・・ japanese-numeralライブラリも試したのですが、「X丁目」部分だけを抜き出す正規表現に手こずって断念しました・・・ 漢数字でConnectのAPIに投げてみて、一応処理はされた様子でしたので、元記事ではアラビア数字指定でしたが、記事内では漢数字のまま投げるようにしています。 京都の通り名 住んでいた時にもよく省略していましたので、個人的には省略したままでいいのではと思っている派です。 役所とかで書く時、絶対に入力欄が足りなくなるんですよね・・・・ ただ、元記事の例外項目に上がっていましたので、「この記事のサンプルでは省略されます」と伝える意味で言及することにしました。 Connectでは本人確認フェーズがありますので、そこで必要になるかもしれず、来年もう少し掘り下げて調べてみるようにします。 返信を追加
hidetaka okamoto2021/12/30コメントありがとうございます! 「Stripe ConnectとそのAPIが要求する仕様に、このライブラリ +αでどこまで対応できるか。」を試す意図でしたので、ライブラリ側の挙動が気になるような書き方になっていてすみません。(「Connect向けに使う上では」を先ほど追記しました) 丁目の漢数字表記 Connect側の要求がアラビア数字なだけで、一般的には漢数字が標準なのかなと思っていましたが、 花巻市のようなケースがあるからなんですね。そして万丁目を10000丁目にするのもかなり厳しそうですね・・・ japanese-numeralライブラリも試したのですが、「X丁目」部分だけを抜き出す正規表現に手こずって断念しました・・・ 漢数字でConnectのAPIに投げてみて、一応処理はされた様子でしたので、元記事ではアラビア数字指定でしたが、記事内では漢数字のまま投げるようにしています。 京都の通り名 住んでいた時にもよく省略していましたので、個人的には省略したままでいいのではと思っている派です。 役所とかで書く時、絶対に入力欄が足りなくなるんですよね・・・・ ただ、元記事の例外項目に上がっていましたので、「この記事のサンプルでは省略されます」と伝える意味で言及することにしました。 Connectでは本人確認フェーズがありますので、そこで必要になるかもしれず、来年もう少し掘り下げて調べてみるようにします。
宮内@geolonia2021/12/30ちなみに Geoloania ではなくて Geolonia です。笑 hidetaka okamoto2021/12/30ほんとすみません・・・ 先ほど修正かけました。 返信を追加
Discussion
弊社のnormalize-japanese-addressesを試していただいてありがとうございます!
これにつきましては、たとえば岩手県の花巻市には「十二丁目」という地名があります。どういうことかというと、ここには十一丁目とか十三丁目があるわけではなく、他の町名に混ざって十二丁目だけがぽつんとある感じです。
このケースの場合12丁目としてしまうことは一郎を1郎と書くことになってしまうため、アラビア数字か漢数字に統一するなら、漢数字のほうが誤りではないという意味で、このライブラリでは漢数字に統一しています。(ちなみに万丁目という地名もあります。笑)
一応弊社では別のライブラリでアラビア数字<=>漢数字の相互変換をするライブラリも用意しておりますが、上述のような問題がありますので、現状ではアラビア数字に変換することはとても困難ですが、デジタル庁によるベースレジストリが整備されれば、このあたりの精度が劇的に改善されると思います。(あと数年かかるかもですが。。。)
京都市の通り名については、それがなくても郵送等では実害がないと弊社では判断しておりまして、弊社の不動産共通IDでも同様の仕様になっており、「置き配」ですでに利用されています。
コメントありがとうございます!
「Stripe ConnectとそのAPIが要求する仕様に、このライブラリ +αでどこまで対応できるか。」を試す意図でしたので、ライブラリ側の挙動が気になるような書き方になっていてすみません。(「Connect向けに使う上では」を先ほど追記しました)
japanese-numeralライブラリも試したのですが、「X丁目」部分だけを抜き出す正規表現に手こずって断念しました・・・
漢数字でConnectのAPIに投げてみて、一応処理はされた様子でしたので、元記事ではアラビア数字指定でしたが、記事内では漢数字のまま投げるようにしています。
ただ、元記事の例外項目に上がっていましたので、「この記事のサンプルでは省略されます」と伝える意味で言及することにしました。
Connectでは本人確認フェーズがありますので、そこで必要になるかもしれず、来年もう少し掘り下げて調べてみるようにします。
ちなみに Geoloania ではなくて Geolonia です。笑
ほんとすみません・・・
先ほど修正かけました。