📖

読みやすい日本語改行を可能にするbudoux-jaの紹介

2023/10/04に公開

どうも@roistaffです。
日本語で書かれたWebサイトの文章が、おかしなところで改行され読みにくくなっていませんか? 
例えば文章の「可能にする」が「可」で改行され、「能にする」が2行目に来たりすると、とても読みにくい時があります。
対策として手動で<br>タグやCSSでいじった<span>タグを入れるという方法がありますが、長文となるとそんなことはやっていられません。しかもデバイスのスクリーンの幅によって改行される部分が異なってきます。
そこで適切な日本語改行を可能にしてくれるbudoux-jaを紹介したいと思います。

日本語改行を可
能にするbudou
↓↓↓↓↓↓↓↓↓↓↓
日本語改行を
可能にするbu

budouxとは

機械学習アルゴリズムを使用した軽量な分かち書き器。日本語と中国語に対応している。Javascript以外にもPythonやJavaからでも扱える。
https://github.com/google/budoux/

google先生のDEMO

導入

使い方はとても簡単です。webサイトでタグとして使用できます。

あなたのwebサイトに
<budoux-ja>budoux-jaは読みやすい日本語改行をしてくれます。</budoux-ja>

<script src="https://unpkg.com/budoux/bundle/budoux-ja.min.js"></script>

nodejsでも使用可能なのでブログなどにも簡単に導入することができます。

npmでインストール
 npm install budoux 
import { loadDefaultJapaneseParser } from 'budoux' ; 
 const parser = loadDefaultJapaneseParser(); 
 console.log(parser.parse('吾輩は猫である。名前はまだ無い。どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。));

出力結果

['吾輩は','猫である。','名前は','まだ無い。','どこで','生れたかとんと','見当が','つかぬ。','何でも','薄暗いじめじめした所で','ニャーニャー泣いていた事だけは','記憶している。','吾輩は','ここで','始めて','人間と','いう','ものを', '見た。']

まとめ

おかしなところで改行されてしまい読みにくくなってしまう問題には以前から悩んでいたので、今後webサイトの日本語の文章には必ず使っていきたい便利なモジュール。また軽量なのでSEOの向上にも貢献できると思います。ぜひ、webサイトを建てるときに導入を考えてみてはどうか。

参照

https://developers-jp.googleblog.com/2023/09/budoux-adobe.html

https://github.com/google/budoux/

Discussion