📣

*.drawio.png と *.drawio.svg とはなんなのか

2021/06/19に公開

VS Code Draw.io Integration の画像エクスポート機能

数ヶ月前に、VS Code の Draw.io Integration が話題になりました。

VSCode で Draw.io が使えるようになったらしい! - Qiita

ただ、上記の記事にもあるようにエクスポート機能はv0.4.0から無効化されており、エクスポート機能を利用するにはオンライン版の Draw.io に繋がないといけないという本末転倒な状況になっているようです。

せっかくエディタ内でドキュメントと作図が完結しそうという素敵な体験にあと一歩というところなので、*.drawioファイルを一括で画像ファイルに変換するスタンドアロンのツールを作ってみたり(kaakaa/dio-exporter)もしましたが、もっと良い方法があったようです。

*.drawio.png*.drawio.svg

Visual Studio Code - *.drawio.svg や *.drawio.png の衝撃 - anfangd's blog

こちらの記事で知ったのですが、ファイルを*.drawio.svg*.drawio.pngという拡張子で保存すると、Draw.io で開くことができ、かつ SVG/PNG ファイルとして扱うことができるようです。

公式リポジトリの方にも記述がありました。

https://github.com/hediet/vscode-drawio#editing-drawiosvgdrawiopng-files

You can directly edit and save .drawio.svg and .drawio.png files. These files are perfectly valid svg/png-images that contain an embedded Draw.io diagram. Whenever you edit such a file, the svg/png part of that file is kept up to date.

なぜ、そんなことができるのかを調べてみました。

なぜ画像ファイルとしても Draw.io としても開けるのか

*.drawio.png or *.dio.png

Draw.io には、extractGraphModelFromPngというメソッドがあり、このメソッドに PNG ファイルから Draw.io のグラフモデルを取得する処理が書かれているようです。

https://github.com/jgraph/drawio/blob/a579fe9c094510093db631283166f35588848113/src/main/webapp/js/diagramly/Editor.js#L1547

  Editor.extractGraphModelFromPng = function(data)
  {
    var result = null;

        ...  (snip) ...

      EditorUi.parsePng(binary, mxUtils.bind(this, function(pos, type, length)
      {
        var value = binary.substring(pos + 8, pos + 8 + length);

        if (type == 'zTXt')
        {
          var idx = value.indexOf(String.fromCharCode(0));

          if (value.substring(0, idx) == 'mxGraphModel')
          {
            // Workaround for Java URL Encoder using + for spaces, which isn't compatible with JS
            var xmlData = pako.inflateRaw(value.substring(idx + 2),
              {to: 'string'}).replace(/\+/g,' ');

            if (xmlData != null && xmlData.length > 0)
            {
              result = xmlData;
            }
          }
        }
        // Uncompressed section is normally not used
        else if (type == 'tEXt')
        {
          var vals = value.split(String.fromCharCode(0));

          if (vals.length > 1 && (vals[0] == 'mxGraphModel' ||
            vals[0] == 'mxfile'))
          {
            result = vals[1];
          }
        }

        if (result != null || type == 'IDAT')
        {
          // Stops processing the file as our text chunks
          // are always placed before the data section
          return true;
        }
      }));

        ...  (snip) ...

PNG ファイルのzTXtチャンク、もしくはtEXtチャンクからグラフモデルを読み出しているようです。

実際に、適当な*.dio.pngファイルを作って中身をみてみます。 以下のコードは PNG を読む - Qiita を参考にしました。

package main

import (
    "bytes"
    "encoding/binary"
    "fmt"
    "io"
    "net/url"
    "os"
)

func parse(r io.Reader) (err error) {
    buffer := new(bytes.Buffer)
    _, err = buffer.ReadFrom(r)
    if err != nil {
        return err
    }
    if string(buffer.Next(8)) != "\x89PNG\r\n\x1a\n" {
        return fmt.Errorf("not a PNG")
    }

    data := make([]byte, 0, 32)
    loop := true
    for loop {
        length := int(binary.BigEndian.Uint32(buffer.Next(4)))
        chunkType := string(buffer.Next(4))

        switch chunkType {
        case "zTXt":
            fmt.Println("chunk: zTXt")
            data = append(data, buffer.Next(length)...)
            _ = buffer.Next(4) // CRC
        case "tEXt":
            fmt.Println("chunk: tEXt")
            data = append(data, buffer.Next(length)...)
            _ = buffer.Next(4) // CRC
        case "IEND":
            fmt.Println("chunk: IEND")
            loop = false
        default:
            fmt.Println("chunk:", chunkType)
            _ = buffer.Next(length) // chunk data
            _ = buffer.Next(4) // CRC
        }
    }
    d, _ := url.QueryUnescape(string(data))
    fmt.Println(d)

    return nil
}

func main() {
    imageFile := "test.dio.png"
    file, err := os.Open(imageFile)
    if err != nil {
        fmt.Println(err)
        return
    }
    defer file.Close()

    err = parse(file)
    if err != nil {
        fmt.Println(err)
        return
    }

    fmt.Println("Complete")
}

実行結果は下記になります。

$ go run main.go
chunk: IHDR
chunk: tEXt
chunk: IDAT
chunk: IEND
mxfile<mxfile host="8ce946a9-c68b-479a-941a-3275fc70c066" modified="2020-07-28T13:37:16.115Z" agent="5.0 (Macintosh; Intel Mac OS X 10_15_5) AppleWebKit/537.36 (KHTML, like Gecko) Code/1.47.0 Chrome/78.0.3904.130 Electron/7.3.2 Safari/537.36" version="13.1.3" etag="9Ipt2ayCl9tVzXnOHPW3" pages="2"><diagram id="TjNWy2FeEwpBci7nIAZN" name="ページ1"><mxGraphModel dx="630" dy="380" grid="1" gridSize="10" guides="1" tooltips="1" connect="1" arrows="1" fold="1" page="1" pageScale="1" pageWidth="827" pageHeight="1169" math="0" shadow="0"><root><mxCell id="0"/><mxCell id="1" parent="0"/><mxCell id="2" value="TEST" style="rounded=0;whiteSpace=wrap;html=1;" vertex="1" parent="1"><mxGeometry x="260" y="170" width="120" height="60" as="geometry"/></mxCell></root></mxGraphModel></diagram><diagram id="R911WMiv1Lcx-Wbf2GqR" name="ページ2"><mxGraphModel dx="630" dy="380" grid="1" gridSize="10" guides="1" tooltips="1" connect="1" arrows="1" fold="1" page="1" pageScale="1" pageWidth="827" pageHeight="1169" math="0" shadow="0"><root><mxCell id="fRIcQMW-JuJCGEe4Us9i-0"/><mxCell id="fRIcQMW-JuJCGEe4Us9i-1" parent="fRIcQMW-JuJCGEe4Us9i-0"/><mxCell id="fRIcQMW-JuJCGEe4Us9i-2" value="HOGE" style="ellipse;whiteSpace=wrap;html=1;" vertex="1" parent="fRIcQMW-JuJCGEe4Us9i-1"><mxGeometry x="260" y="160" width="120" height="80" as="geometry"/></mxCell></root></mxGraphModel></diagram></mxfile>
Complete

実行結果を見ると、Draw.io のグラフモデルは zTXtチャンク ではなく tEXtチャンク として保存されているようです。
tEXtチャンクの中身は、XML 要素ではないmxfileというワードで始まっていることと、パーセントエンコードされていること以外は、Draw.io のデータ保存形式と同じように見えます。実際、先頭のmxfileを外した XML をファイルに保存し、Draw.io Integration で開いてみたところ問題なく開けました。


Draw.io のコード内では、tEXtチャンクは基本的に使われないだろうというコメントが書かれています。

// Uncompressed section is normally not used
else if (type == 'tEXt')

しかし、VS Code Draw.io Integration で*.drawio.pngファイルを作成した場合は、そのtEXtチャンクにデータが保存されています。
個人的な予想ですが、エディタでの操作だと保存回数が多くなるため、保存のたびに圧縮をかける必要のあるzTXtチャンクでは保存操作に対するレスポンスが悪くなる恐れがあるため、tEXtチャンクを採用しているのではないかと思っています。

*.drawio.svg or *.dio.svg

SVG ファイルの中身は XML ファイルなので、テキストファイルとして開けば <svg> タグの content属性の値として、HTML エンコードされた Draw.io のグラフモデルが格納されていることがわかります。

<svg
  xmlns="http://www.w3.org/2000/svg"
  xmlns:xlink="http://www.w3.org/1999/xlink"
  version="1.1"
  width="121px"
  height="81px"
  viewBox="-0.5 -0.5 121 81"
  content="&lt;mxfile host=&quot;40cbe15d-9605-4d22-a796-b079811d4635&quot; modified=&quot;2020-07-28T13:50:29.983Z&quot; agent=&quot;5.0 (Macintosh; Intel Mac OS X 10_15_5) AppleWebKit/537.36 (KHTML, like Gecko) Code/1.47.0 Chrome/78.0.3904.130 Electron/7.3.2 Safari/537.36&quot; etag=&quot;dN67jIN7lHvydTadAscc&quot; version=&quot;13.1.3&quot; pages=&quot;2&quot;&gt;&lt;diagram id=&quot;6hGFLwfOUW9BJ-s0fimq&quot; name=&quot;Page-1&quot;&gt;jZJNb8MgDIZ/DfcQtq69Luu2y06ptDMKXkAicUTJkuzXjwyTD1WVdsJ+bIP9YiaKZnxzstMfqMCyPFMjEy8szznPsnDMZIpEnB4iqJ1RlLSC0vwAQaqre6Pgukv0iNabbg8rbFuo/I5J53DYp32h3b/ayRpuQFlJe0s/jfI60mP+tPJ3MLVOL/PDKUYamZJpkquWCocNEmcmCofoo9WMBdhZvKRLrHu9E10ac9D6/xTkseBb2p5mu5zLC/XmpzSww75VMNdkTDwP2ngoO1nN0SF8cWDaNzZ4PJh0JTgP4922+DJs2BLABrybQgoViEfShxaEH8kfVrl50lBvpD4Qk/TD9XL1KkIwSIfkrnr/xTZbK86/&lt;/diagram&gt;&lt;diagram id=&quot;KO23mSEetFSPKnzUMudc&quot; name=&quot;ページ2&quot;&gt;rZNNT4QwEIZ/DcdNKNX9OK4sLhdjIgejt0pnaZNCSbcrsL/eYocv92BMPNF5Zvq2fWcIaFy2R8Nq8aQ5qCAKeRvQQxBFhISh+/Sk84Tu7jwojORYNIFMXgEh7isuksN5UWi1VlbWS5jrqoLcLhgzRjfLspNWy1NrVsANyHKmbumr5FZ4uo02E09BFmI4max3PlOyoRhfchaM62aGaBLQ2Ght/apsY1C9eYMvody/vL1/HNr0tE6S+CpWe7nyYo9/2TI+wUBl/1eaeulPpi7oV/p8TPC9thtMdEquXy54aIS0kNUs7zONGxnHhC2Vi4hbohwYC+0P/3+5PBkddaMIugRrOrcPVeg9NgGnkGwwbqaekqFRYtbPLTKGY1SM0pNVboFuDeHU1O/c7NegyRc=&lt;/diagram&gt;&lt;/mxfile&gt;"
>
    <defs/>
    <g>
        <ellipse cx="60" cy="40" rx="60" ry="40" fill="#ffffff" stroke="#000000" pointer-events="all"/>
        <g transform="translate(-0.5 -0.5)">
            <switch>
      ... (snip) ...

懸念点

*.drawio.png*.drawio.svg形式で保存することで、画像ファイルとしても扱えますし、Draw.io で開けば追加で編集も加えられるとても便利なファイルを作成することができます。しかし、いくつか懸念すべき点があります。

ファイルサイズが大きくなる

*.drawio.png*.drawio.svgは、画像ファイルとしてのデータと Draw.io としてのデータの両方を持つことになるため、どうしてもファイルサイズは大きくなってしまいます。また、VS Code Draw.io Integration で作成すると、Draw.io のデータは圧縮されずに tEXt チャンクに格納されるため、その点でもファイルサイズを低減できていません。
Web ページに使用するなど、容量にシビアな環境では画像ファイルとしてエクスポートし直す必要がありそうです。

複数ページを扱うことはできない

Draw.io では一つのファイルに複数ページ(タブ)を作成することができますが、画像として参照できるのは1ページのみです。(おそらく最初のページ) 複数ページの存在する Draw.io ファイルを画像表示するには、各ページを別ファイルに分割する必要があります。
kaakaa/dio-exporterは複数ページの Draw.io ファイルから複数の画像ファイルを出力できるようになっているはずです)

おわりに

*.drawio.png*.drawio.svgというファイル形式にはいくつか懸念事項はありますが、作っているツールの概要をサクッと書きたいときなどは、とても役に立つと思います。

また、どうやら本体の Draw.io Integration の方でも、PNG エクスポートの機能は追加される予定のようです。

執筆時点(2020/07/28)での最新版である v0.7.2 では使えませんが、もしかしたら PNG エクスポートの機能は復活するのかもしれません。

Discussion