次世代のMarkdownみたいなDjotの話
Djotとは
Djotは2022年に登場した軽量マークアップ言語で、Pandocの作者でありCommonMarkの主要開発者でもあるカリフォルニア大学バークレー校の哲学部教授のJohn MacFarlaneさんが開発しています。
Djotの構文は基本的にはCommonMark(Markdown)と似ていますが、CommonMarkの構文の複雑で効率的な解析が難しい部分を修正しています。
また、CommonMarkにない機能として説明リスト、脚注、表、いくつかの種類のインライン書式設定、数式、スマート句読点、どの要素にも適用できる属性、ブロックレベル、インラインレベル、未加工コンテンツ向けの汎用コンテナをサポートしています。
新機能
Djotで追加された機能はGFMやPandocのMarkdownで似たような構文でサポートされているものもあります。
説明リスト
Djot
: 用語
詳細
HTML
<dl>
<dt>用語</dt>
<dd><p>詳細</p></dd>
</dl>
脚注
GitHubなどがサポートしている脚注と同じような構文です。
表
GFMなどの表と同じような構文です。
書式設定
Djot
{+挿入+}
{-削除-}
{=ハイライト=}
b^n^
O~3~
HTML
<p><ins>挿入</ins></p>
<p><del>削除</del></p>
<p><mark>ハイライト</mark></p>
<p>b<sup>n</sup></p>
<p>O<sub>3</sub></p>
数式
LaTeXの数式を含めることができます。
Djot
$`E=mc^{2}`
$$`x=\frac{-b\pm\sqrt{b^{2}-4ac}}{2a}`
HTML
<p><span class="math inline">\(E=mc^{2}\)</span></p>
<p><span class="math display">\[x=\frac{-b\pm\sqrt{b^{2}-4ac}}{2a}\]</span></p>
Markdownとの比較
Djotの機能の殆どはCommonMark(Markdown)から派生していますが、構文を簡素化したり解析を容易にするためにCommonMarkから削除されたり変更されたりしてる構文がいくつかあります。
ブロックレベル要素は空白行で区切る必要がある
Djotでは見出しや段落などのブロックレベル要素は空白行で区切る必要があります。
以下のテキストを入力した場合:
# 見出し
段落
Markdownでは以下のように解釈されます:
<h1>見出し</h1>
<p>段落</p>
Djotでは空白行で区切られていないことから見出しが継続していると解釈されて以下のようになります:
<h1>見出し 段落</h1>
DjotでMarkdownと同じ解釈をする場合は以下のように見出しと段落を空白行で区切る必要があります:
# 見出し
段落
見出し
Djotには#
を使用するATX形式の見出しだけがあります。
=
か-
を使用するSetext形式の見出しはありません。
コードブロック
インデントによるコードブロックはなく、3つ以上のバッククォート(`
)で囲むコードブロックだけがあります。
強調
Markdownでは_
か*
が1つの場合は強調で2つの場合は強い強調でしたが、Djotでは記号の個数ではなく種類で表すように変更されており、1つの_
で囲まれている場合は強調で*
で囲まれている場合は強い強調になります。
日本語のようにわかち書きをしない場合でもこれらの記号は1つだけで機能します。
Markdown
_強調_ **強い強調**
等しいDjot
_強調_ *強い強調*
改行
Markdownでは強制的に改行したい場合は行末に2つのスペースを挿入しましたが、Djotでは行末に\
を挿入すると強制的に改行されるように変更されています。
実装
Djotは既にいくつかのプログラミング言語で実装されています。
また、Pandocはバージョン3.1.12からDjotの入出力に対応しています[1]。
Djot.lua
オリジナルのリファレンス実装でLuaで書かれています。
スクリプト言語で書かれていますがDjotが効率的に解析できるように設計されているので非常に高速に処理することができます。
現在はdjot.jsの開発に重点が置かれているので最新の構文変更に対応していない可能性があります。
djot.js
TypeScriptで書かれたオリジナルのリファレンス実装の再実装で、現在はこちらの開発に重点が置かれています。
Djota
Prologによる実装です。
Jotdown
Rustのライブラリとして実装されているプル・パーサーです。
godjot
Goで書かれたパーサーです。
djoths
Haskellで書かれたパーサーです。
Pandocはこれを使用しています。
Discussion