✍️

文章校正AI Typolessを試してみた

2023/12/07に公開

こんにちは、株式会社ZOZOでDevRelをしています、wiorhaです。本記事は技術広報 Advent Calendar 2023の7日目の記事です。

私は趣味や仕事で文章を書いたりレビューをしたりするため、校正に関心があります。技術広報の皆さんも、技術ブログのレビュー・校正に関心があるのではないでしょうか。少し前に朝日新聞社さんの文章校正AI Typolessが公開され、試してみたので感想をまとめてみます。

概要の紹介

Typolessには「AI校正」「ルール辞書」の機能があります。それぞれの説明を公式サイトから引用します。

朝日新聞社の膨大な記事校正履歴を学ばせた「AI校正」
新聞の膨大な校正履歴を学習させたAIは文脈を解釈し、「てにをは」などの助詞や同音異義語の誤りを置換・削除・挿入の三つの方法で提示します。

朝日新聞社の校閲ルールを活用
新聞社の校閲ルール(約10万個)が詰め込まれています。誤りやすい日本語・漢字・慣用句・専門用語などの修正候補を提示します。

このほかに、自分で用語を登録するカスタム辞書機能もあります。「技術書典」といった固有名詞は「技術書店」「技術書点」のように誤りやすいため、登録するとよさそうです。

料金は料金表でご確認ください。執筆時点(2023年12月2日)では個人利用の場合はスタンダードプランが2,200円/月、プレミアムプランが5,500円/月です。企業・団体の場合は10名まで49,500円/月です。

校正にかけてみる

TypolessはWebブラウザ上で動くツールで、文字入力フォームに自分の文章を入力して「校正」ボタンから校正にかけます。次の図は私が先日書いた「女性エンジニアコミュニティで技術書典14と15に参加しました」の記事をTypolessにかけてみたものです。

1,762文字の文章の内、AI校正による指摘が2ヶ所、ルール辞書による指摘が32ヶ所ありました。「出すと場合」となっていて不要な「と」が残っていたのを指摘してくれています。「締切」も指摘されており、調べてみたところ公用文では「締め切り」または「締切り」が使われるそうです。厳密な校正をしています。勉強になりました。

一方、「場合」に対して「合」を「合い」に置換するよう指摘していますが、これは元のままで正しく修正不要です。また「胃が痛く」という表現に対して「副詞の場合はかな書き『いたく』」を使用すると指摘していますが、この文章では副詞として使っている訳ではありません。「AI校正」は文脈を解釈しているそうですが、「ルール辞書」は単純に文字列の一致で検出しているようです。「修正した方がよいかもしれない候補」の提示であり、実際に直すべきかは自身で調べるという使い方になるでしょう。

校正精度を変えてみる

校正精度は「積極的」から「消極的」まで三段階あります。指摘の分量の差を見てみるため、もう少し長い文章を校正にかけてみます。技術書典15で執筆・頒布した「Code Polaris Tech Book vol.2」の自分の章で試してみました。文字数は7,357文字、8ページほどの内容です。

積極的:AI校正 19ヶ所、ルール辞書 140ヶ所

中間:AI校正 11ヶ所、ルール辞書 140ヶ所

消極的:AI校正 1ヶ所、ルール辞書 140ヶ所

指摘数が変わるのはAI校正だけのようです。指摘数が多すぎると確認が大変になるため精度が変えられるのかと思ったのですが、ルール辞書の指摘の方がよほど多いです。この違いであれば、自分ならば念のために「積極的」を使うだろうなと思いました。

所感

試してみたところ、かなり多くの指摘・修正候補が出ました。絶対にミスが入り込んではならない、まさに新聞のような用途で使うツールだと感じました。また同人誌をつくるときも、紙で印刷する場合は使うのも手だと思います。ブログや電子書籍と異なり、誤りに気付いても後での修正ができないためです。気付き次第修正すれば問題ない媒体の場合、ここまで厳密にするとひとつひとつ精査する手間が相対的に大きいように感じました。

技術広報の方が会社の技術ブログでこういったツールを活用するかどうかは、求める精度・執筆のフロー・予算・レビュアーの人数やかけられる工数によって検討するとよいと思います。セキュリティ面はFAQに記載があります。「APIでのご利用可能なAPI連携プランは2023年12月以降にサービス開始予定です。」とあるので、Webフォーム経由ではなく自動化できるならば検討する方もいるかと思います。皆さまの参考になれば幸いです。

Discussion