非エンジニアがCursorでPDFとOfficeファイル読み込みできずにやったこと
概要
非エンジニアのCursor利用で困ったこと第二弾
次はPDFやOfficeファイルを読み込みです。これらファイルを読み込みたいと思った人は多いのではないでしょうか
結論、MarkItDownを使うと良いです
詳細
CursorはPDFやOfficeのファイルを読み込めない
CursorにPDF読み込みを依頼してもできないと回答。Officeファイルも同じ
業務を行っているとPDFやOfficeのファイルを作る/もらうことが多くあります
そのようなファイルを読み込んで資料作成をしたかったのですが、何度Cursorに読み込み依頼しても上手く行かない…
MarkItDownでPDFやOfficeファイルを読み込む
MarkItDownを使うとPDFやOfficeのファイルの書き起こしができます
書き起こしたファイルをCursorに読み込ませて色々な業務に活用できます
MarkItDownのインストール方法
MarkItDownはターミナルで以下のコマンドを打つとインストールできます
pip install 'markitdown[all]'
ターミナルは画面上部のタブから開けます。
Cursorのタブ。右の方のTerminalタブからターミナルが開ける
pipが使えない方は以下を参照してPythonをインストールしてください
MarkItDownの使い方
上記インストール後、ターミナルで以下のコマンドを打つとファイルの内容を書き起こせます
markitdown 対象ファイルのパス > 書き起こししたいファイル名
サンプルは以下です
ターミナルのコマンド例。sample.pdfの内容をsample.txtに書き起こすコマンド
書き起こし結果
チャットでmarkitdownの利用を依頼することもできます
チャットでのmarkitdownの利用依頼。依頼に応じて必要なコマンドを打ってくれる
ただし仮想環境を使っていると上記が機能しないようです。例えばvenvで仮想環境を立てた場合はコマンドを以下に変えてもらう必要性がありました
仮想環境を使った時のチャット欄で必要なmarkitdownコマンド
注意事項
音声ファイルも書き起こしできるみたいなのですが、エラーが出て駄目でした
以下記事の下部に記載されているようにバグが発生してるみたいですね
一応、MCPもあります。同僚に紹介してもらったのですが、自分はまだ使えてないです
関連情報
CursorでWeb情報を読み込みたい時
ローカルファイル以外の重要な情報源としてWeb検索があります
MarkItDownでHTMLも読み込めますが、そもそもCursor上でWeb検索が可能です
詳細は以下をご覧ください。@Webコマンドというものがあります
終わりに
各種ファイルが読み込めるようになればCursorの活用の幅も広がると思います
是非MarkItDownを使ってみてください
Discussion