🏢

非エンジニアがCursorでPDFとOfficeファイル読み込みできずにやったこと

に公開

概要

非エンジニアのCursor利用で困ったこと第二弾

次はPDFやOfficeファイルを読み込みです。これらファイルを読み込みたいと思った人は多いのではないでしょうか
結論、MarkItDownを使うと良いです

詳細

CursorはPDFやOfficeのファイルを読み込めない


CursorにPDF読み込みを依頼してもできないと回答。Officeファイルも同じ

業務を行っているとPDFやOfficeのファイルを作る/もらうことが多くあります
そのようなファイルを読み込んで資料作成をしたかったのですが、何度Cursorに読み込み依頼しても上手く行かない…

MarkItDownでPDFやOfficeファイルを読み込む

MarkItDownを使うとPDFやOfficeのファイルの書き起こしができます
書き起こしたファイルをCursorに読み込ませて色々な業務に活用できます

https://github.com/microsoft/markitdown

MarkItDownのインストール方法

MarkItDownはターミナルで以下のコマンドを打つとインストールできます

pip install 'markitdown[all]'

ターミナルは画面上部のタブから開けます。

Cursorのタブ。右の方のTerminalタブからターミナルが開ける

pipが使えない方は以下を参照してPythonをインストールしてください

https://qiita.com/BlueEventHorizon/items/a51d83f7339b28d67efb

https://zenn.dev/picaneru/articles/a5e6c4d9836c5b

MarkItDownの使い方

上記インストール後、ターミナルで以下のコマンドを打つとファイルの内容を書き起こせます

markitdown 対象ファイルのパス > 書き起こししたいファイル名

サンプルは以下です


ターミナルのコマンド例。sample.pdfの内容をsample.txtに書き起こすコマンド


書き起こし結果

チャットでmarkitdownの利用を依頼することもできます


チャットでのmarkitdownの利用依頼。依頼に応じて必要なコマンドを打ってくれる

ただし仮想環境を使っていると上記が機能しないようです。例えばvenvで仮想環境を立てた場合はコマンドを以下に変えてもらう必要性がありました


仮想環境を使った時のチャット欄で必要なmarkitdownコマンド

注意事項

音声ファイルも書き起こしできるみたいなのですが、エラーが出て駄目でした
以下記事の下部に記載されているようにバグが発生してるみたいですね

https://qiita.com/pokurin123/items/ef368fca29801afbd889

一応、MCPもあります。同僚に紹介してもらったのですが、自分はまだ使えてないです

https://github.com/microsoft/markitdown/tree/main/packages/markitdown-mcp

関連情報

CursorでWeb情報を読み込みたい時

ローカルファイル以外の重要な情報源としてWeb検索があります
MarkItDownでHTMLも読み込めますが、そもそもCursor上でWeb検索が可能です
詳細は以下をご覧ください。@Webコマンドというものがあります

https://qiita.com/okikusan-public/items/69f2d14f71c4176481e5

終わりに

各種ファイルが読み込めるようになればCursorの活用の幅も広がると思います
是非MarkItDownを使ってみてください

Discussion