🦔

Salesforce Dataloader(UTF-8)で取得したCSV文字化けをなおす方法

2021/09/13に公開

この記事の目的

  • 数ヶ月ぶりに触ると毎回忘れて、試したり調べたりする時間が無駄なのでメモ(今更)

試したけどできなかったこと

  • Salesforce Dataloaderの設定で、Export、write時の文字コードをUTF-8にする
    • 何個か記事は見たけど。意味なかった。
  • 出力したCSVを保存する時に、文字コードをUTF-8に選択して保存する
    • Windowsだと選択できるかもだけど、Macではそもそも選択できなかった
    • あと、多分意味なさそう(知らんけど)
  • Excelのデータimport(テキストファイル)で、文字コードUTF-8を選択
    • カンマ区切り
    • →データ量重すぎてimportできない。

手順

CSVファイルでExport

  • デフォルトだとExcelで開くとかになってるはず

テキストエディタで開く

  • 私はSublime Text使ってました。
  • Visual Studioでもなんでもいいと思います。

「,」を「 」(インデント)に置換(replace)

  • テキストエディタのどこかでTabキーを押す
  • でてきたインデントをコピー(⌘+XでOK)
  • 全ての「,」を「 」(インデント)に置換
  • で保存。新しいファイルとして保存の方がいいかも

テキストエディタで開いたCSVをExcelにコピペ

  • テキストファイルを全てコピー
  • Excelで新規ブック(ファイル)またはシートを作成
  • A1セルにペースト
    • 書式クリアとか気にしなくてOK
  • これでOK。
  • なぜかExcelのデータimport(テキスト)よりめちゃ早い。

終わり。ただしデータはくそ重いです。

  • 当たり前ですが。
  • Pythonで分析できるようにしたい

Discussion