Open1
window上でのjumanpp環境構築時にPCの言語設定で引っかかった話
環境構築時に行ったことはこちらの記事通りなので割愛.
JUMAN++をWindows環境で動かしてみる
C:\jumanpp\jumanpp.batを実行すると構文解析ができるはずなんですが,以下エラーが出現
InvalidParameter: Invalid UTF8 sequence: すもももももももものうち
backtrace:
jumanpp::chars::preprocessRawData at C:\..(インストールディレクトリ)..\jumanpp-2.0.0-rc3\src\util\characters.cc:268
jumanpp::core::analysis::AnalysisInput::reset at C:\..(インストールディレクトリ)..\jumanpp-2.0.0-rc3\src\core\analysis\analysis_input.cc:22
jumanpp::core::analysis::AnalyzerImpl::resetForInput at C:\..(インストールディレクトリ)..\jumanpp-2.0.0-rc3\src\core\analysis\analyzer_impl.cc:21
jumanpp::core::analysis::Analyzer::analyze at C:\..(インストールディレクトリ)..\jumanpp-2.0.0-rc3\src\core\analysis\analyzer.cc:46
jumanpp::core::input::PlainStreamReader::analyzeWith at C:\..(インストールディレクトリ)..jumanpp-2.0.0-rc3\src\core\input\stream_reader.h:38# ERROR
これに関しては,Windowsの文字コード設定により引き起こされていたっぽい.ネットにもあまり載っていないようなので忘備録.
Windowsの文字コード設定変更報はこちらを参考にしました
Windows 10の文字コード(システムロケール)をUTF-8に変更する方法