Open1

window上でのjumanpp環境構築時にPCの言語設定で引っかかった話

trmttrmt

環境構築時に行ったことはこちらの記事通りなので割愛.
JUMAN++をWindows環境で動かしてみる

C:\jumanpp\jumanpp.batを実行すると構文解析ができるはずなんですが,以下エラーが出現

InvalidParameter: Invalid UTF8 sequence: すもももももももものうち
backtrace:
    jumanpp::chars::preprocessRawData at C:\..(インストールディレクトリ)..\jumanpp-2.0.0-rc3\src\util\characters.cc:268
    jumanpp::core::analysis::AnalysisInput::reset at C:\..(インストールディレクトリ)..\jumanpp-2.0.0-rc3\src\core\analysis\analysis_input.cc:22
    jumanpp::core::analysis::AnalyzerImpl::resetForInput at C:\..(インストールディレクトリ)..\jumanpp-2.0.0-rc3\src\core\analysis\analyzer_impl.cc:21
    jumanpp::core::analysis::Analyzer::analyze at C:\..(インストールディレクトリ)..\jumanpp-2.0.0-rc3\src\core\analysis\analyzer.cc:46
    jumanpp::core::input::PlainStreamReader::analyzeWith at C:\..(インストールディレクトリ)..jumanpp-2.0.0-rc3\src\core\input\stream_reader.h:38# ERROR

これに関しては,Windowsの文字コード設定により引き起こされていたっぽい.ネットにもあまり載っていないようなので忘備録.

Windowsの文字コード設定変更報はこちらを参考にしました
Windows 10の文字コード(システムロケール)をUTF-8に変更する方法