<p>環境構築周りはこちらの記事を参考<br style="display:none">
<span class="embed-block zenn-embedded zenn-embedded-card"><iframe id="zenn-embedded__e33db433b9d6" src="https://embed.zenn.studio/card#zenn-embedded__e33db433b9d6" data-content="https%3A%2F%2Fzenn.dev%2Fyassh_i%2Farticles%2F33d00fb94e7adb" frameborder="0" scrolling="no" loading="lazy"></iframe></span><a href="https://zenn.dev/yassh_i/articles/33d00fb94e7adb" style="display:none" target="_blank">https://zenn.dev/yassh_i/articles/33d00fb94e7adb</a></p>
<h2 id="hadoop%E3%82%B5%E3%83%BC%E3%83%90%E3%83%BC%E3%81%ABssh%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#hadoop%E3%82%B5%E3%83%BC%E3%83%90%E3%83%BC%E3%81%ABssh%E3%81%99%E3%82%8B" aria-hidden="true"></a> HadoopサーバーにSSHする</h2>
<h3 id="1.-ssh%E3%82%AD%E3%83%BC%E3%82%92%E4%BD%9C%E6%88%90">
<a class="header-anchor-link" href="#1.-ssh%E3%82%AD%E3%83%BC%E3%82%92%E4%BD%9C%E6%88%90" aria-hidden="true"></a> 1. SSHキーを作成</h3>
<h3 id="hadoop%E3%81%AE%E3%82%B5%E3%83%BC%E3%83%90%E3%83%BC%E3%82%A2%E3%83%89%E3%83%AC%E3%82%B9%E3%81%AE%E8%A8%AD%E5%AE%9A%E3%82%92%E8%A8%98%E8%BF%B0%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#hadoop%E3%81%AE%E3%82%B5%E3%83%BC%E3%83%90%E3%83%BC%E3%82%A2%E3%83%89%E3%83%AC%E3%82%B9%E3%81%AE%E8%A8%AD%E5%AE%9A%E3%82%92%E8%A8%98%E8%BF%B0%E3%81%99%E3%82%8B" aria-hidden="true"></a> hadoopのサーバーアドレスの設定を記述する</h3>
<p>下記2つのファイルに，記述内容を追記する</p>
<div class="code-block-container">
<div class="code-block-filename-container"><span class="code-block-filename">etc/hadoop/core-site.xml</span></div>
<pre class="language-xml"><code class="language-xml"><span class="token tag"><span class="token tag"><span class="token punctuation">&lt;</span>configuration</span><span class="token punctuation">&gt;</span></span>
    <span class="token tag"><span class="token tag"><span class="token punctuation">&lt;</span>property</span><span class="token punctuation">&gt;</span></span>
        <span class="token tag"><span class="token tag"><span class="token punctuation">&lt;</span>name</span><span class="token punctuation">&gt;</span></span>fs.defaultFS<span class="token tag"><span class="token tag"><span class="token punctuation">&lt;/</span>name</span><span class="token punctuation">&gt;</span></span>
        <span class="token tag"><span class="token tag"><span class="token punctuation">&lt;</span>value</span><span class="token punctuation">&gt;</span></span>hdfs://localhost:9000<span class="token tag"><span class="token tag"><span class="token punctuation">&lt;/</span>value</span><span class="token punctuation">&gt;</span></span>
    <span class="token tag"><span class="token tag"><span class="token punctuation">&lt;/</span>property</span><span class="token punctuation">&gt;</span></span>
<span class="token tag"><span class="token tag"><span class="token punctuation">&lt;/</span>configuration</span><span class="token punctuation">&gt;</span></span>
</code></pre>
</div><p>こうなっていればよい<br>
<img src="https://storage.googleapis.com/zenn-user-upload/gn1c8rzr28fz8jphh620a1fdxydt" alt loading="lazy" class="md-img"></p>
<div class="code-block-container">
<div class="code-block-filename-container"><span class="code-block-filename">etc/hadoop/hdfs-site.xml</span></div>
<pre class="language-xml"><code class="language-xml"><span class="token tag"><span class="token tag"><span class="token punctuation">&lt;</span>configuration</span><span class="token punctuation">&gt;</span></span>
    <span class="token tag"><span class="token tag"><span class="token punctuation">&lt;</span>property</span><span class="token punctuation">&gt;</span></span>
        <span class="token tag"><span class="token tag"><span class="token punctuation">&lt;</span>name</span><span class="token punctuation">&gt;</span></span>dfs.replication<span class="token tag"><span class="token tag"><span class="token punctuation">&lt;/</span>name</span><span class="token punctuation">&gt;</span></span>
        <span class="token tag"><span class="token tag"><span class="token punctuation">&lt;</span>value</span><span class="token punctuation">&gt;</span></span>1<span class="token tag"><span class="token tag"><span class="token punctuation">&lt;/</span>value</span><span class="token punctuation">&gt;</span></span>
    <span class="token tag"><span class="token tag"><span class="token punctuation">&lt;/</span>property</span><span class="token punctuation">&gt;</span></span>
<span class="token tag"><span class="token tag"><span class="token punctuation">&lt;/</span>configuration</span><span class="token punctuation">&gt;</span></span>
</code></pre>
</div><p>こうなっていればよい<br>
<img src="https://storage.googleapis.com/zenn-user-upload/4fd3db22y6qo4g87radu868ruhym" alt loading="lazy" class="md-img"></p>
<aside class="msg message"><span class="msg-symbol">!</span><div class="msg-content">
<p>ここでタイプミスなどをしていると，<strong>NameNode起動</strong>の際にUnexpected~でエラーが出る</p>
</div></aside>
<h3 id="hadoop%E7%94%A8%E3%81%AEjava_home%E3%82%92%E8%A8%AD%E5%AE%9A%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#hadoop%E7%94%A8%E3%81%AEjava_home%E3%82%92%E8%A8%AD%E5%AE%9A%E3%81%99%E3%82%8B" aria-hidden="true"></a> hadoop用のJAVA_HOMEを設定する</h3>
<div class="code-block-container"><pre><code>sudo vi hadoopのディレクトリ/etc/hadoop/hadoop-env.sh
</code></pre></div><p>文字がたくさん書かれたファイルが開かれるはず<br>
下記を追記する</p>
<div class="code-block-container"><pre><code>export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-armhf/jre/
export PATH=$PATH:$JAVA_HOME/bin
</code></pre></div><h3 id="namenode%E8%B5%B7%E5%8B%95">
<a class="header-anchor-link" href="#namenode%E8%B5%B7%E5%8B%95" aria-hidden="true"></a> NameNode起動</h3>
<div class="code-block-container"><pre><code># ログがたくさん出る．SHUTDOWN_MSG: Shutting down NameNode at raspberrypi/127.0.1.1みたいなのが出ればOK
hadoopのディレクトリ/bin/hdfs namenode -format

# 出力結果は下記
hadoopのディレクトリ/sbin/start-dfs.sh
</code></pre></div><div class="code-block-container"><pre><code>hadoop@raspberrypi:~/hadoop-3.2.2 $ sbin/start-dfs.sh
Starting namenodes on [localhost]
Starting datanodes
Starting secondary namenodes [raspberrypi]
OpenJDK Client VM warning: You have loaded library /home/hadoop/hadoop-3.2.2/lib/native/libhadoop.so.1.0.0 which might have disabled stack guard. The VM will try to fix the stack guard now.
It's highly recommended that you fix the library with 'execstack -c &lt;libfile&gt;', or link it with '-z noexecstack'.
2021-01-26 22:00:35,106 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
</code></pre></div><h3 id="namenode%E3%81%AB%E3%82%A2%E3%82%AF%E3%82%BB%E3%82%B9">
<a class="header-anchor-link" href="#namenode%E3%81%AB%E3%82%A2%E3%82%AF%E3%82%BB%E3%82%B9" aria-hidden="true"></a> NameNodeにアクセス</h3>
<p>SSHしているなら，同じWiFiに接続している状態で<code>http://ラズパイのローカルIP(192.168.~):9870</code>にアクセスする．<br>
ラズパイ本体でブラウザを使用できる場合は，<code>http://localhost:9870</code>でOK</p>
<p>アクセスできました<br>
<img src="https://storage.googleapis.com/zenn-user-upload/zv8oytgzromakdpsfgm91xc51npg" alt loading="lazy" class="md-img"></p>
<details><summary>Tips：Hadoopのログ</summary><div class="details-content">
<p>Hadoopのディレクトリのlogs/に入っています<br>
こんな感じ</p>
<div class="code-block-container"><pre><code>hadoop@raspberrypi:~/hadoop-3.2.2 $ head logs/hadoop-hadoop-namenode-raspberrypi.log
2021-01-26 22:00:22,140 INFO org.apache.hadoop.hdfs.server.namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG:   host = raspberrypi/127.0.1.1
STARTUP_MSG:   args = []
STARTUP_MSG:   version = 3.2.2
STARTUP_MSG:   classpath = /home/hadoop/hadoop-…たくさん(改行されていないからheadが意味なかった)
STARTUP_MSG:   build = Unknown -r 7a3bc90b05f257c8ace2f76d74264906f0f7a932; compiled by 'hexiaoqiao' on 2021-01-03T09:26Z
STARTUP_MSG:   java = 1.8.0_212
************************************************************/
</code></pre></div>
</div></details>
<h3 id="mapreduce%E3%82%B8%E3%83%A7%E3%83%96%E3%81%AB%E5%BF%85%E8%A6%81%E3%81%AAhdfs%E3%83%87%E3%82%A3%E3%83%AC%E3%82%AF%E3%83%88%E3%83%AA%E3%82%92%E4%BD%9C%E6%88%90%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#mapreduce%E3%82%B8%E3%83%A7%E3%83%96%E3%81%AB%E5%BF%85%E8%A6%81%E3%81%AAhdfs%E3%83%87%E3%82%A3%E3%83%AC%E3%82%AF%E3%83%88%E3%83%AA%E3%82%92%E4%BD%9C%E6%88%90%E3%81%99%E3%82%8B" aria-hidden="true"></a> MapReduceジョブに必要なHDFSディレクトリを作成する</h3>
<p>下記コマンドで作成可能</p>
<div class="code-block-container"><pre><code>hadoop@raspberrypi:~/hadoop-3.2.2 $ bin/hdfs dfs -mkdir /user
hadoop@raspberrypi:~/hadoop-3.2.2 $ bin/hdfs dfs -mkdir /user/hadoop
</code></pre></div><p>こんな警告がいちいち出てきます．OpenJDKを入れたのが原因がわかりませんが，デバッグレベルなら気にしなくていい警告みたいです</p>
<div class="code-block-container"><pre><code>OpenJDK Client VM warning: You have loaded library /home/hadoop/hadoop-3.2.2/lib/native/libhadoop.so.1.0.0 which might have disabled stack guard. The VM will try to fix the stack guard now.
It's highly recommended that you fix the library with 'execstack -c &lt;libfile&gt;', or link it with '-z noexecstack'.
2021-01-26 22:18:34,110 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
</code></pre></div><h3 id="user%E3%83%95%E3%82%A9%E3%83%AB%E3%83%80%E3%81%AB%E3%82%B8%E3%83%A7%E3%83%96%E7%94%A8%E3%81%AE%E3%83%95%E3%82%A9%E3%83%AB%E3%83%80%E3%82%92%E4%BD%9C%E6%88%90%E3%81%99%E3%82%8B">
<a class="header-anchor-link" href="#user%E3%83%95%E3%82%A9%E3%83%AB%E3%83%80%E3%81%AB%E3%82%B8%E3%83%A7%E3%83%96%E7%94%A8%E3%81%AE%E3%83%95%E3%82%A9%E3%83%AB%E3%83%80%E3%82%92%E4%BD%9C%E6%88%90%E3%81%99%E3%82%8B" aria-hidden="true"></a> Userフォルダにジョブ用のフォルダを作成する</h3>
<p>先頭の記事で作成済みのものを，Userフォルダの中に作成します</p>
<div class="code-block-container"><pre><code>hadoop@raspberrypi:~/hadoop-3.2.2 $ bin/hdfs dfs -mkdir input
hadoop@raspberrypi:~/hadoop-3.2.2 $ bin/hdfs dfs -put etc/hadoop/*.xml input
</code></pre></div><details><summary>この段落をスルーして，前のコマンドでええんやろ！てやるとこういうエラーが出ます</summary><div class="details-content"><div class="code-block-container"><pre><code>2021-01-26 22:25:05,242 INFO impl.MetricsConfig: Loaded properties from hadoop-metrics2.properties
2021-01-26 22:25:05,443 INFO impl.MetricsSystemImpl: Scheduled Metric snapshot period at 10 second(s).
2021-01-26 22:25:05,443 INFO impl.MetricsSystemImpl: JobTracker metrics system started
2021-01-26 22:25:06,003 INFO mapreduce.JobSubmitter: Cleaning up the staging area file:/tmp/hadoop/mapred/staging/hadoop541450179/.staging/job_local541450179_0001
org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://localhost:9000/user/hadoop/input
        at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:332)
        at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:274)
        at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits(FileInputFormat.java:396)
        at org.apache.hadoop.mapreduce.JobSubmitter.writeNewSplits(JobSubmitter.java:310)
        at org.apache.hadoop.mapreduce.JobSubmitter.writeSplits(JobSubmitter.java:327)
        at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:200)
        at org.apache.hadoop.mapreduce.Job$11.run(Job.java:1565)
        at org.apache.hadoop.mapreduce.Job$11.run(Job.java:1562)
        at java.security.AccessController.doPrivileged(Native Method)
        at javax.security.auth.Subject.doAs(Subject.java:422)
        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1762)
        at org.apache.hadoop.mapreduce.Job.submit(Job.java:1562)
        at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1583)
        at org.apache.hadoop.examples.Grep.run(Grep.java:78)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:76)
        at org.apache.hadoop.examples.Grep.main(Grep.java:103)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:498)
        at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:71)
        at org.apache.hadoop.util.ProgramDriver.run(ProgramDriver.java:144)
        at org.apache.hadoop.examples.ExampleDriver.main(ExampleDriver.java:74)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:498)
        at org.apache.hadoop.util.RunJar.run(RunJar.java:323)
        at org.apache.hadoop.util.RunJar.main(RunJar.java:236)
</code></pre></div></div></details>
<p>ユーザーを作成したらそのユーザーの場所にいろいろ作るようにされるんですかね，，，</p>
<details><summary>実行成功すると以下のようなログが出ます</summary><div class="details-content">
<p><img src="https://storage.googleapis.com/zenn-user-upload/u8wg7jjwv94e2hy57oi583g3ju2c" alt loading="lazy" class="md-img"></p>
</div></details>
<h3 id="%E3%81%A7%E3%81%8D%E3%81%9F%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%82%92%E8%A6%8B%E3%82%8B">
<a class="header-anchor-link" href="#%E3%81%A7%E3%81%8D%E3%81%9F%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%82%92%E8%A6%8B%E3%82%8B" aria-hidden="true"></a> できたファイルを見る</h3>
<p>HDFSシステムの中にOutputが作られているので，それをローカルに持ってきて，見ます．<br>
下記コマンドでできます</p>
<div class="code-block-container"><pre><code>hadoop@raspberrypi:~/hadoop-3.2.2 $ bin/hdfs dfs -get output output
hadoop@raspberrypi:~/hadoop-3.2.2 $ cat output/*
cat: output/output: ディレクトリです
1       dfsadmin
</code></pre></div><p>outputの中身はこうなっていました</p>
<div class="code-block-container"><pre><code>hadoop@raspberrypi:~/hadoop-3.2.2/output $ ls
_SUCCESS  output  part-r-00000
</code></pre></div><h3 id="%E5%8B%95%E3%81%84%E3%81%A6%E3%81%84%E3%82%8B%E5%BD%A2%E8%B7%A1">
<a class="header-anchor-link" href="#%E5%8B%95%E3%81%84%E3%81%A6%E3%81%84%E3%82%8B%E5%BD%A2%E8%B7%A1" aria-hidden="true"></a> 動いている形跡</h3>
<p>NameNode informationはこんな画面に<br>
<img src="https://storage.googleapis.com/zenn-user-upload/9dicps6c908p7q125qba9vbv0k4o" alt loading="lazy" class="md-img"></p>
<p>DataNodeがひとつできているのでそこにアクセスすると，<br>
<img src="https://storage.googleapis.com/zenn-user-upload/xgmkkz2tu88tfuh5hs8zwjmwiyov" alt loading="lazy" class="md-img"><br>
このようになっています．</p>
<p>次回は完全分散モード！と行きたいところですが，丸1日かかりそう(ハードウェア等も調達，セットアップしないとなので)です．気長にお待ちください</p>


ラズパイでHadoopの疑似分散モードを試してみる

hadoopのサーバーアドレスの設定を記述する

MapReduceジョブに必要なHDFSディレクトリを作成する

Userフォルダにジョブ用のフォルダを作成する

Discussion