remarkとmarkdown-itでbudouxを扱うライブラリを書いたよ
はじめに
みなさんは「budoux」というツールを知っていますか?
英語等では単語間にスペースが入るため、テキスト処理や改行位置の調整が比較的容易です。しかし、日本語では通常、文中で分かち書きを行わないため、自然な改行は意外と困難です。
このような問題を解決するために、Googleが開発したのが「budoux」というライブラリです。
budouxは、日本語テキストに対して、適切な改行位置を自動的に判定し、そこにゼロ幅スペース(​
)を挿入する軽量なライブラリです。これにより、ページレイアウトやデバイス幅に応じた自然な改行を実現することができます。特別なプラグインや追加要素を付与しなくとも、軽量な構成で自然な文字区切りを行える点は嬉しいポイントです。
手動で<wbr />
タグを埋め込むことで改行位置を制御することもできますが、あまりにも現実的ではありません。そこでbudouxを用いることで、自動的かつ適切な改行ポイントを挿入でき、みんなハッピーというわけです。
私自身は、以下のようなユースケースでbudouxを使いたいと考え、remark-budoux
とmarkdown-it-budoux
というプラグインを作成しました。
- Astroで構築している自分のブログ
- Slidev(Vueを用いたスライド作成フレームワーク)
remarkプラグインについて
簡潔に書くことができました。
下記のコードがその実装です。
やっていることは非常にシンプルで、テキストノードに対してbudouxのtranslateHTMLString
関数を適用することで、budouxが挿入したゼロ幅スペース入りのHTML文字列を生成します。最後にノードタイプをhtml
に変更することで、出力結果がHTMLとして正しく解釈されるようにしています。
markdown-itプラグインについて
重要なのはこの部分だけです。
paragraph_open
は、markdown-itがMarkdownをHTMLに変換する過程で使用する内部トークンの一種であり、おおよそのケースでは<p>
タグへと変換されます。その<p>
タグに対して、下記のようなスタイルを適用しています。これはremark-budoux
で出力されたものと同じスタイルです。
const WORD_BREAK_STYLE = 'word-break:keep-all;overflow-wrap:anywhere;';
次に、budouxのparse関数を用いて分ち書きされた文字列の配列を取得します。次にゼロ幅スペースで結合することで、remark-budouxと似た挙動を実現しています。
理想としてはtranslateHTMLString
によるHTML文字列をそのまま解釈させたかったのですが、markdown-it
の知識が足りず期待通りの動作をさせることができなかったため、このような力技による実装方法を取っています。
プラグインの使いかた
remark-budouxの使いかた
Astroでの使いかたを例に出します。
$ npm install remark-budoux
ライブラリをプロジェクトに追加した後、Astro.config.mjs
に組み込みます。
+import remarkBudoux from "remark-budoux";
export default defineConfig({
+ markdown: {
+ remarkPlugins: [remarkBudoux],
+ },
});
markdown-it-budouxの使いかた
次にSlidevでの使いかたを例に出します。
$ npm install markdown-it-budoux
ライブラリをプロジェクトに追加し、vite.config.js
に設定を追記します。
import { defineConfig } from 'vite'
import '@slidev/cli'
+import markdownItBudoux from 'markdown-it-budoux'
export default defineConfig({
slidev: {
+ markdown: {
+ markdownItSetup(md) {
+ md.use(markdownItBudoux)
+ },
+ },
},
})
おわりに
今回初めてnpmへpublishする経験をすることができました。うれしいね。
残タスクとしてはGithub Actionsが整備しきれていないので、そこを進めていきたいです。
参考リンク
Discussion