🐨

セマンティックチャンクの手法の一つであるAdjacent Sequence Clusteringを試してみた

2024/11/12に公開

チャンク分割の手法を調べる機会があって、この手法を新しく知ったので紹介

セマンティックチャンキングとは

そもそもセマンティックチャンクはドキュメント内のテキストを意味・関連ごとに分けていく方法のこと。
決めた文字数ごとに分けたりページごとに分けるわけではないので、チャンク内のテキストが整合性を保てるようになる。
あとはチャンク内に不要なノイズも含まれなくなるメリットがある。

Adjacent Sequence Clusteringとは

そんなセマンティックチャンキングの手法の一つである。
方法はテキストを文章ごとに分割して、前後の文章の意味が近ければ結合、離れていれば次のチャンクに分割していく。
文章は一度ベクトル化して類似度を計算する。
意味ごとに分けていくので、チャンクごとに文字数はかなり前後する。

処理の流れは以下

  1. まずはドキュメントを1文単位(。や改行コードなどで判別)で分割
  2. 1文ごとにベクトル化
  3. ループ処理を走らせて、次の文と類似度を計算し近ければ文を統合
  4. もし離れていれば新しいチャンクとして切り出す

試してみる

LangChainのSemanticChunkerが同様の処理をするので使います。

https://python.langchain.com/docs/how_to/semantic-chunker/

前提

  1. データセットはWikipediaからスターウォーズのページの情報を取得して使用します。
  2. 実装はPython Notebookを使用します。

1. パッケージ導入

%pip install --quiet wikipedia-api langchain_experimental langchain_openai


2. データセットの用意

chunking.ipynb
import wikipediaapi

search_word = "スター・ウォーズシリーズ"
filename = f"{search_word}.txt"

wiki = wikipediaapi.Wikipedia("KnowledgeData",'ja')
page = wiki.page(search_word)

if page.exists():
    print("タイトル: %s" % page.title)
    print("概要: %s" % page.summary[0:1000])

    with open(filename, "w", encoding="utf-8") as f:
        f.write(page.text + "\n")
else:
    print("ページが見つかりませんでした。")


3. チャンク分割処理

SemanticChunkerのsplit_text関数を使用します。
breakpoint_threshold_typeにはデフォルトのpercentileを定義。
・日本語を分割するのでsentence_split_regexは「。」と「.」と「\n」に変更します。(デフォルトが英語向きの設定になっている。)
・1チャンクの最低サイズを100にします。

chuking.ipynb
from langchain_experimental.text_splitter import SemanticChunker
from langchain_openai import AzureOpenAIEmbeddings

with open(filename) as f:
    file_content = f.read()

embeddings = AzureOpenAIEmbeddings(
    model="text-embedding-3-small",
    azure_endpoint=<your aoai endpoint>,
    api_key=<your aoai key>,
    openai_api_version="2024-02-01",
)
text_splitter = SemanticChunker(embeddings=embeddings, breakpoint_threshold_type="percentile", sentence_split_regex=r"。|.|\n", min_chunk_size=100)
chunks = text_splitter.split_text(file_content)


計21個のチャンクに分割されました。


4. データを確認

chunking.ipynb
cnt = 1
for i in chunks:
    chunk_filename = f"{search_word}_chunk{cnt}.txt"
    cnt +=1
    words = i.split(" ")
    with open(chunk_filename, "w", encoding="utf-8") as f:
            for word in words:
                f.write(word + "\n")


スター・ウォーズシリーズ_chunk1

「スター・ウォーズ」(Star
Wars)は、ジョージ・ルーカスが製作し、1977年に公開された同名の映画から始まるアメリカのスペースオペラシリーズである
映画だけでなく、アニメーション、小説、コミック、ゲームなど複数の媒体で展開される

後に『エピソード4/新たなる希望』と改題されるオリジナルの映画『スター・ウォーズ』(1977年)を皮切りに、『エピソード5/帝国の逆襲』(1980年)、『エピソード6/ジェダイの帰還』(1983年)の旧三部作が製作された

その後、『エピソード1
/ファントム・メナス』(1999年)、『エピソード2
/クローンの攻撃』(2002年)、『エピソード3
/シスの復讐』(2005年)の新三部作が製作され、シリーズは一度幕を閉じた

2012年、ルーカスは制作会社のルーカスフィルムをウォルト・ディズニー・カンパニーに売却し、フランチャイズの所有権を放棄した
その後『エピソード7/フォースの覚醒』(2015年)、『エピソード8/最後のジェダイ』(2017年)、『エピソード9/スカイウォーカーの夜明け』(2019年)の続三部作が製作された
これらの9作品は「スカイウォーカー・サーガ」としてシリーズの柱となっている

実写スピンオフ映画『ローグ・ワン』(2016年)と『ハン・ソロ』(2018年)を合わせて映画の合計興行収入は100億米ドル以上に相当し、現在、歴代映画フランチャイズの中で2番目に高い興行収入を記録している

スター・ウォーズシリーズ_chunk2

世界設定
『スター・ウォーズ』シリーズは、「遠い昔、遥か彼方の銀河系で」の登場人物たちの冒険を描いている
そこでは、人間と多くの種の異星人(多くの場合はヒューマノイド)が、日常生活を支援してくれるロボットや「ドロイド」と共存しており、光速の超空間技術によって惑星間の宇宙旅行が一般的に行われている
宇宙船には、小型のスターファイターからスター・デストロイヤーのような巨大な宇宙戦艦、月面サイズのデス・スターのような宇宙ステーションまで様々なものがある
通信には、双方向のオーディオやオーディオ・ビジュアル・スクリーン、ホログラフィック・プロジェクションなどがある

フォースと呼ばれる神秘的な力は、原作では「すべての生物が作り出すエネルギーフィールド......(それは、)銀河を束ねる」と説明されている
「フォースが強い」者は、訓練や瞑想によって、さまざまな超能力(念力、予知能力、テレパシー、物理的エネルギーの操作など)を発揮することができる

ジェダイは銀河共和国の平和維持者であり、無執着と仲裁によってフォースのライト・サイドを行使し、シスは恐怖と攻撃性を操ることで闇ダーク・サイドを行使するという、互いに対立する2つの主要な騎士団によってフォースが行使されている
ジェダイの騎士は数が多いが、シスの暗黒卿(または「ダース」)は、マスターとその弟子の2人に限定されることになっている

フォースの使い手は、平均的な人口に比べて数が非常に限られている
ジェダイとシスは、ライトセーバーと呼ばれる武器を好んで使用する
ライトセーバーは、ほぼすべての表面を切り裂き、エネルギーボルトを逸らすことができるエネルギーの刃である
それ以外の人々や、反逆者や兵士は、レーザーを使ったブラスター銃器を使用する
銀河系外縁部では、ハットのカルテルのような犯罪シンジケートが支配的である
賞金稼ぎはギャングと政府の両方に雇われることが多い
密輸や奴隷制などの違法行為も行われている

スター・ウォーズシリーズ_chunk3

映画
映画『スター・ウォーズ』シリーズは、「スカイウォーカー・サーガ(Skywalker
saga)」と総称される3組の3部作が中心となっている

これらは非時系列的に製作されており、エピソード4~6(旧3部作)は1977年から1983年の間に、エピソード1~3(新3部作)は1999年から2005年の間に、エピソード7~9(続3部作)は2015年から2019年の間に公開されている
それぞれの3部作は、フォースに敏感なスカイウォーカー家の一世代に焦点を当てている
旧3部作はルーク・スカイウォーカーの英雄的な成長を描き、新3部作は父アナキンのバックストーリーを、続3部作はルークの甥であるカイロ・レンを主役にしている
原作者のジョージ・ルーカスは後に、「新3部作を父の物語、旧3部作を息子の物語、続3部作を娘・孫の物語とし、続3部作ではルークによるジェダイの再建とレイアによる新共和国の創設を描こうと計画していた」と明かしている

メインエピソードの間に設定された「アンソロジー・シリーズ」は、続3部作の制作と並行して開発に入り、ディズニーのCFOであるジェイ・ラズロは、オリジン・ストーリーと表現している
最初の作品である『ローグ・ワン』(2016年)は、エピソード4の直前にデス・スターの設計図を盗んだ反乱軍の物語である
『ハン・ソロ』(2018年)は、同名のキャラクターのバックストーリーに焦点を当て、旧3部作の共同主人公であるチューバッカとランド・カルリジアンも登場し、新3部作の悪役であるダース・モールも関わっている

ルーカスフィルムは、スター・ウォーズの映画を数多く開発しており、そのうちの2本が、2020年のディズニー・インベスター・デイで確認された
1つ目は、パティ・ジェンキンスが監督を務める『Rogue
Squadron』というタイトルの映画で、2023年12月25日に公開予定である

2つ目は、2020年5月にクリスティ・ウィルソン=ケアンズと共同執筆していたスター・ウォーズ映画の監督を務めることが発表されたタイカ・ワイティティによる未発表の映画である
さらに、『最後のジェダイ』の脚本・監督のライアン・ジョンソンによって、スカイウォーカー・サーガから独立した3部作が執筆されている
2019年9月には、キャスリーン・ケネディとマーベル・スタジオ社長のケヴィン・ファイギが共同でスター・ウォーズ映画を開発することが発表された
2020年2月には、監督のJ・D・ディラードと脚本家のマット・オーウェンズによる映画が開発中であることが発表された

2018年2月には、『ゲーム・オブ・スローンズ』のショーランナーを務めたデイヴィッド・ベニオフとD・B・ワイスが脚本、製作を担当するスター・ウォーズ映画の開発が発表されるも、ベニオフとワイスの多忙を理由に2019年10月には立ち消えとなった
また、製作が予定されたオビ=ワン・ケノービとボバ・フェットのスピンオフ映画は、2018年6月に『ハン・ソロ』の興行不振の影響で保留となり、ボバ・フェットの映画は2018年10月に製作中止となり、オビ=ワン・ケノービのスピンオフはドラマシリーズとして製作されることが、2019年8月に発表された

スター・ウォーズシリーズ_chunk4

スカイウォーカー・サーガ
旧三部作/オリジナル・トリロジー
ルーク・スカイウォーカーを主人公とするシリーズで、1977年から1983年にかけて公開された
スピンオフを含むスター・ウォーズ全作品の大元となる作品群である
第1作『スター・ウォーズ』(1977年)は大衆文化に大きな影響をもたらし、続編『帝国の逆襲』(1980年)、『ジェダイの復讐』(1983年)も世界的にヒットした

1971年、ユニバーサル映画はルーカスが監督を務める2作品について契約を結んだ
最初に製作された『アメリカン・グラフィティ』は成功を収め、ルーカスはアカデミー賞にノミネートされた
数か月後、ルーカスは2作目の草案を提出したがユニバーサルは草案を拒否したため、20世紀フォックスと契約を結んだ
1974年までにルーカスは草案を下敷きにして脚本を書き上げ(この時点でシス、デス・スター、アナキン・スターキラー(アナキン・スカイウォーカー)などの要素が加えられた)、物語が全9部作になると主張して20世紀フォックスと交渉し、監督として5万ドル、脚本家として5万ドル、プロデュース費用として5万ドルを受け取った
製作を確実なものとしたルーカスは、監督としての報酬を抑える代わりに、マーチャンダイジングの権利は全てルーカスフィルムが持つと認めさせ(トム・ポロックは、「交渉において、我々は20世紀フォックスのビル・ラーマンとの間で契約を立案しました
我々はジョージが権利を所有することで合意しました」と述べている)、自らの管理でキャラクターやメカのグッズを製造・発売し、巨額の富を得た
この利益を基に、後の新三部作(プリクエル・トリロジー)はルーカスフィルムの自己資金で製作されている

映画が時系列では4番目にあたる『新たなる希望』から制作されたのは、まず1作目が商業的に成果を収めねばシリーズ化が望めず、その意味で一番「冒険活劇」としての完成度が高かった『新たなる希望』を最初に世に出すことが得策だと判断されたためである
また新三部作の時代は、全銀河の首都である大都市惑星コルサントの描写や、銀河共和国と独立星系連合の間で勃発した大規模戦争であるクローン戦争の描写が必須にもかかわらず、当時の映像技術と予算では映画化が不可能だったのも理由にある

スター・ウォーズシリーズ_chunk5

特別篇
1997年、新三部作(プリクエル・トリロジー)の公開に先駆けて『スター・ウォーズ』『帝国の逆襲』『ジェダイの復讐』の特別篇が順次公開された
ルーカスの製作意図に一層近づいた形にするべく、フィルムの物理的な洗浄や素材フィルムまで戻った光学合成シーンのデジタル合成によるやり直し、再撮影及びCGによる新規シーンの追加等が行われた
音響効果もバラつきが統合され、サウンドトラック全体もヒスノイズ低減処理を経て再編集された
一方で、行われた変更の中にはいわゆる「ハンが先に撃った」など、旧来のファンの間で論争を引き起こしたものもある

その後2004年にDVD、2011年にBlu-ray
Discと新規の映像ソフトが発売されるたび、新三部作との整合化など、この特別篇にさらに修正が加えられていった
現在はテレビオンエアもこちらのバージョンが標準になっており、初公開時のオリジナル版を鑑賞することは困難となっている(ただし、2006年にDVDが発売された際に、初公開時のオリジナル版が特典として同梱されている)

スター・ウォーズシリーズ_chunk6

新三部作/プリクエル・トリロジー
アナキン・スカイウォーカーを主人公とするシリーズで、1999年から2005年にかけて公開された
旧三部作の前日譚に当たる

1987年、ルーカスはマーシア・ルーカスとの離婚和解で財産を失い映画製作の意欲をなくし、『ジェダイの帰還』以降の続編計画は中断してしまう
しかし、1990年代の映像技術の進歩に触発され、シリーズの再開を考えるようになった
この間、スター・ウォーズはティモシイ・ザーンの『スローン三部作』やダークホースコミックスの『ダークエンパイア』などのスピンオフ作品によって人気を回復した
スター・ウォーズ人気が衰えていないことを知ったルーカスは、再び監督として製作に復帰する
1999年に『ファントム・メナス』が公開され、2002年に『クローンの攻撃』、2005年に『シスの復讐』が公開された

旧三部作と比較すると遥かに発達した特撮・CG技術や派手なカメラワークが目立ち、シリーズの見所の一つであるライトセーバーの殺陣も非常にアクロバティック化した
ルーカスは新たな映像信号規格・HD24Pの導入によるデジタルシネマの推進に意欲的に取り組み、『エピソード2/クローンの攻撃』において長編映画では史上初めて完全デジタル撮影を行った
その後、映画界では撮影機材のデジタル化が急速化し、映画の歴史に一つの転換期をもたらすことになった

ルーカスは長年スター・ウォーズシリーズのために作成した資料の量を誇張しており(その理由をマイケル・カミンスキーは宣伝と情報保安を目的にしていると述べている)、「ルーカスが『ジェダイの帰還』の後に続く物語を企画している」という憶測が生まれた
しかしルーカスは『シスの復讐』以降の作品は製作しないと明言し、「私はよく"『ジェダイの帰還』の後に何が起きるんですか?"と聞かれますが、それに対する答えを持っていません
映画はアナキンとルークの物語であり、ルークは銀河を救い父を取り戻して物語は終結しています」と語ったことにより、スター・ウォーズシリーズは全九部作の予定を全六部作と修正して一旦の完結を迎えた

続三部作/シークエル・トリロジー
レイを主人公とするシリーズで、2015年から2019年にかけて公開された
旧三部作の後日譚に当たり、世界歴代興行成績の上位を塗り替えるヒットを記録している

オリジナル映画の公開に先立ち、その成功によって可能となったルーカスの計画は「9本の映画からなる3つの三部作」であり、1978年にTime誌にこのことを発表し、1981年にはその概要を確認している
開発の様々な段階で、続3部作は共和国の再建、旧三部作のオビ=ワンのような役割でのルークの復帰、ルークの妹(レイアとはまだ決まっていない)、ハン、レイア、R2-D2とC-3POに焦点を当てる予定だった
しかし、新三部作の制作を始めた後、ルーカスは『スター・ウォーズ』は6部作であることを意味し、続三部作は存在しないと主張した

2011年に入り、ルーカスは『スター・ウォーズ』の新しい映画作品について仕事を始めた
2012年にウォルト・ディズニー・カンパニーがルーカスフィルムを買収してスター・ウォーズシリーズの著作権を取得、配給会社も20世紀フォックスからウォルト・ディズニー・スタジオ・モーション・ピクチャーズに変更され、新体制での再スタートとなった
2015年に『フォースの覚醒』、2017年に『最後のジェダイ』、2019年に『スカイウォーカーの夜明け』が公開され、本来想定されていた九作で完結した

買収後のルーカスフィルム社長にはキャスリーン・ケネディが就任
作品自体は引き続きルーカスフィルムが製作するが、ルーカス本人は今までのように製作総指揮は行わず、製作現場から退き「クリエイティブ顧問」という特別な役職に就任した
マーク・ハミルはディズニーの制作について、「ルーカスの構想していたのとは大きく異なるものだ」と言及した
また、20世紀フォックスが永久的配給権・販売権を所有する『エピソード4』を除いて、オリジナル&プリクエル・トリロジーの同権利も2020年5月にディズニー/ルーカスフィルムに移行する予定になっていた
2013年に親会社(ニューズ・コープ)の分社化により21世紀フォックスが設立され、20世紀フォックスは傘下となり、その後2017年12月14日にウォルト・ディズニー・カンパニーは21世紀フォックスのエンターテインメント部門を総額661億ドル(7兆4000億円)で買収することに最終合意したと発表
これにより『スター・ウォーズ』全ての権利を完全にディズニー/ルーカスフィルムが有することとなった

スター・ウォーズシリーズ_chunk7

デジタル3D版
2010年に本シリーズの『エピソード1〜6』のデジタル3D化が発表された
そのためのデジタル3D変換技術の開発がイン・スリー社において行われたが、これは人物や背景などのシーン中の全対象物の3次元形状を3DCGモデルで再現し、そこに元映像をマッピングして3Dレンダリングするという非常に手間のかかるものでコストの問題が解決出来ずキャンセルされ、ルーカスとILMの監修の下プライム・フォーカス社においてデジタル3D変換が行われることになった

2012年には『エピソード1/ファントム・メナス』のデジタル3D版が公開され、以後『エピソード2〜6』のデジタル3D版がエピソード順に公開される予定だったが、同年10月にウォルト・ディズニー・カンパニーがルーカスフィルムを買収し、続三部作(シークエル・トリロジー)の製作を決定したためそちらに尽力することとなり、デジタル3D版の公開は事実上の凍結状態となっている
この影響で日本でも『エピソード1/ファントム・メナス』のデジタル3D版公開終了後に3D版Blu-ray
Discの発売が予定されていたが中止となった
全世界の映画館での興行公開は現在も行われていないものの、『エピソード2/クローンの攻撃』のデジタル3D版は2013年7月26日から7月28日にドイツのメッセ・エッセンで開催された「スター・ウォーズ
セレブレーション
ヨーロッパⅡ」にてイベント上映され、『エピソード3/シスの復讐』のデジタル3D版は2015年4月16日から4月19日にアメリカのカリフォルニア州アナハイムで開催された「スター・ウォーズ
セレブレーションアナハイム」にてイベント上映されている

スター・ウォーズシリーズ_chunk8

アンソロジー・シリーズ
実写映画本編を補完する実写映画シリーズ
2013年、ルーカスフィルムがスター・ウォーズのメインストーリーとは別の劇場映画をいくつか製作すると報じられ、2015年4月にアメリカのカリフォルニア州アナハイムで開催された本シリーズのオフィシャルファンイベント「スター・ウォーズ
セレブレーションアナハイム」で、これらの実写映画スピンオフ作品群は「アンソロジー・シリーズ」のレーベル名の下で公開されることが明らかにされた(ただし、アンソロジーという言葉はどのタイトルにも使われておらず、代わりに宣伝用の「スター・ウォーズ・ストーリー(A
Star
Wars
Story)」というサブタイトルが付けられている)
アンソロジー映画の一作目は、『ローグ・ワン/スター・ウォーズ・ストーリー』2016年12月に公開され、『エピソード4/新たなる希望』で紹介された帝国軍からデススターの設計図を入手した反乱軍に焦点を当て、評価でも、興行的にも成功を収めた
二作目の『ハン・ソロ/スター・ウォーズ・ストーリー』は、2018年5月に公開され、若き日のハン・ソロを中心に、チューバッカやランドが脇役として登場した
評価はおおむね好評だったが、興行成績は振るわず、計画されていたオビ=ワン・ケノービとボバ・フェットのスピンオフ映画に影響を及ぼした

スター・ウォーズシリーズ_chunk9

テレビシリーズ
ルーカスフィルム・アニメーションが制作している主要なアニメーション作品では、『エピソード2/クローンの攻撃』から『エピソード3/シスの復讐』冒頭の戦いまでをシームレスに繋ぐ2Dアニメのテレビシリーズ『スター・ウォーズ
クローン大戦』や、同じく『エピソード2/クローンの攻撃』と『エピソード3』の間の時代を舞台にクローン大戦における戦いの一端を描いた3DCGアニメ映画『スター・ウォーズ/クローン・ウォーズ』、そしてその続編となるクローン大戦の様々な戦場を描く3DCGアニメのテレビシリーズ『スター・ウォーズ/クローン・ウォーズ』が発表されている

また、ウォルト・ディズニー・カンパニーによるルーカスフィルム買収後も、『エピソード3/シスの復讐』と『エピソード4/新たなる希望』の間の時代の、反乱同盟軍が結成されるまでの物語を描いた3DCGアニメのテレビシリーズ『スター・ウォーズ
反乱者たち』が発表されている

3Dアニメーション
2Dアニメーション
実写ドラマ
2018年10月3日、企画されていた実写ドラマのタイトルが『マンダロリアン』になると製作、脚本を務めるジョン・ファヴローが自身のInstagramで発表した

10月4日、スター・ウォーズ公式サイトにて、作中の画像と共に、一作目の監督をデイブ・フィローニ、その後のエピソードの監督をデボラ・チョウ、リック・ファムイーワ、ブライス・ダラス・ハワード、タイカ・ワイティティが、プロデューサーにはジョン・ファヴロー、キャスリーン・ケネディ、コリン・ウィルソン、エグゼイティブ・プロデューサーにはカレン・ギルクリストが参加することが発表された
2020年にはシーズン2が配信され、2022年に配信予定のシーズン3製作が発表されている
またスピンオフシリーズのAhsokaおよびRangers
of
the
New
Republicの製作が発表されている
さらに、The
Book
of
Boba
Fettの製作も発表されている

その他、2022年配信予定のAndor、同じく2022年配信予定のThe
Acolyteの製作が発表されている

スター・ウォーズシリーズ_chunk10

テレビ映画
イウォーク2部作
旧三部作の成功を受けて、『エピソード6/ジェダイの帰還』に登場した惑星エンドアのイウォーク族を主人公にしたテレビ映画
日本では劇場用映画として公開された
『エピソード6/ジェダイの帰還』にてルーク達と出会う以前の、ウィケット・W・ウォリックらイウォーク族の冒険を描く
子供向けに実写映画本編より対象年齢を下げて制作されている

スター・ウォーズシリーズ_chunk11

ゲーム
アクション
Atari
2600

ファミリーコンピュータ/Nintendo
Entertainment
System

スーパー
スター・ウォーズ

レベルアサルト

ローグ
スコードロン

スターファイター

ゲームボーイアドバンス

バトルフロント

アクションアドベンチャー
映画の翻案

クローン・ウォーズ

フォース・アンリーシュド

アーケード
レーシング
ロールプレイング
Knights
of
the
Old
Republic

シミュレーション
Xウィング

ストラテジー
FPS
スター・ウォーズ
ジェダイナイト

レゴ
スター・ウォーズ
中止されたゲーム
計画中のゲーム
主なストーリーの時系列
前述の通り、映画の公開は時系列通りになっていない
それをスピンオフ等も含め歴史通りに整理すると、エピソード1
ファントム・メナス→エピソード2
クローンの攻撃→クローン・ウォーズ全シリーズ→エピソード3
シスの復讐→ハン・ソロ
スター・ウォーズ
ストーリー→スター・ウォーズ反乱者たち全シーズン→ローグワン
スター・ウォーズ
ストーリー→エピソード4
新たなる希望→エピソード5
帝国の逆襲→エピソード6
ジェダイの帰還(ジェダイの復讐)→スター・ウォーズ
バトルフロント2→スター・ウォーズ
レジスタンス→エピソード7
フォースの覚醒→エピソード8
最後のジェダイ→エピソード9
スカイウォーカーの夜明けとなる

スター・ウォーズシリーズ_chunk12

主な登場キャラクター
アナキン・スカイウォーカー
/
ダース・ベイダー(Anakin
Skywalker
/
Darth
Vader)
「プリクエル・トリロジー」の主人公
また、「オリジナル・トリロジー」における最大の敵でもある
惑星タトゥイーンで暮らす奴隷の少年だったが、フォースの資質を見出されて銀河共和国を護るジェダイ騎士団に「予言にあるフォースにバランスをもたらすもの」として迎えられる
アソーカ・タノを弟子にとりクローン戦争で活躍
しかしその生い立ちと境遇故により強い力を渇望するようになり、最終的には共和国に潜伏していたシスの暗黒卿“ダース・シディアス”に誘惑され、側近“ダース・ベイダー”へと生まれ変わり反乱を起こす
ジェダイと共和国を滅ぼした後、負傷により全身サイボーグの姿となり、新たに成立した銀河帝国をシディアスと共に統治していく
のちに息子によって改心、シディアスとシスを滅ぼし、その際受けた攻撃が仇となり絶命するが、結果として予言通りにフォースにバランスをもたらした
その後はアナキン時代の姿で霊体として復活
エクセゴルの戦いではオビ=ワン・ケノービやクワイ=ガン・ジン、アソーカらとともにレイに呼びかけた

ルーク・スカイウォーカー(Luke
Skywalker)
「オリジナル・トリロジー」の主人公
アナキンの息子として生まれるが、シディアスのジェダイ狩りから逃れるため父の故郷タトゥイーンで育てられる
成長後、自身がジェダイの血を引く存在であると知り、帝国への反乱軍に協力することを決意
戦闘を経験する中で秘めたる才能が徐々に覚醒する
ベイダーは父親を殺害した怨敵だと聞かされていたが、そのベイダーこそが実の父親だった
深いショックを受け、かつてのアナキンのように心が暗黒面へと出向いていく
しかし最後はその誘惑を撥ね返してベイダーとシディアスを討ち、銀河に一時的な平和を取り戻す
その後新たなジェダイの育成を試みるが、甥の反乱に心を病み、オク=トーに引き籠る
レイに修行をつけフォースの幻影を使い甥のカイロ・レンと対決し、力尽きてフォースと一体化
霊体として残りレイアの霊体とともにレイを見守った

レイ・スカイウォーカー(Rey
Skywalker)
「シークエル・トリロジー」の主人公
惑星ジャクーにて一人暮らす少女
幼少期に家族と離れ離れになり、廃船から奪った部品を売って生活しながら再会を待ち望んでいた
実は生まれながらに高いフォースの資質を持ち、訓練を受けていない段階でも戦士として高い能力を発揮する
BB-8やフィンとの出会いをきっかけにレジスタンスと、ファースト・オーダーとの戦いに関わるようになる
やがて戦いの中でカイロ・レンがファースト・オーダーの最高指導者となり、レイがシディアスの孫“レイ・パルパティーン”であるという真実を告げられる
さらに、復活したシディアスの後を継ぐ未来を予知してしまう
しかし最後はファースト・オーダーや、復活したシディアスが組織するシス艦隊“ファイナル・オーダー”との激闘の末に、未来の予知を撥ね返してレンとともに祖父シディアスを討ち、銀河に真の平和を取り戻す
その後はレイ・パルパティーンではなくレイ・スカイウォーカーを名乗っている

レイア・オーガナ(Leia
Organa)
アナキンの子で、ルークの双子の妹として生まれたが、ベイル・オーガナ夫妻に引き取られオルデランで王女として育てられる
外交官としても活躍していてその頃に反乱者のエズラ・ブリッジャーとも接触している
その後、反乱同盟のリーダーとして銀河帝国との戦いに参加し、ルークやハン・ソロ、オビ=ワンとともに第一デス・スターの設計図を届ける任務をやり遂げヤヴィンの戦いに勝利した
帝国滅亡後、実兄ルークに師事し修行中に妊娠、ハンとの間にベン・ソロをもうける
その後もレジスタンスの将軍として息子達が率いるファースト・オーダーと戦った
カイロ・レンとなった息子にフォースで働きかけ改心させ、やがて疲れ果てレジスタンスをポー・ダメロンに任せ息を引き取った
その後もフォースの霊体として残り、レイを支えた

C-3PO(See-Threepio)
金色の装甲を持つヒューマノイド型のプロトコル(儀礼・通訳用)ドロイド
R2-D2と共に、全エピソードに登場しているキャラクター

R2-D2(Artoo-Detoo)
宇宙船や電子機器のオペレートを主目的としたアストロメク・ドロイド
C-3POと共に、全エピソードに登場しているキャラクター

ハン・ソロ(Han
Solo)
密輸船「ミレニアム・ファルコン」の船長
帝国軍の歩兵であったがチューバッカと出会い共に帝国を逃走、ベケットの盗賊団に参加した
その後ルークやレイアと出会い反乱同盟軍に参加、将軍となる
帝国滅亡後にレイアとの間に後のカイロ・レンとなるベン・ソロを設ける
しかし彼によってスターキラー基地の戦いで殺される
その後、デス・スターの残骸でレイに敗北したベンの記憶の中の存在として現れ、彼を改心させた

チューバッカ(Chewbacca)
ハン・ソロの相棒であるウーキー族の戦士
エピソード3以降の全作品に登場
クローン戦争中のキャッシークの戦いでヨーダと共に参戦し、オーダー66から彼を救っている
帝国時代に奴隷として囚われていたところをハンに命を救われ共に帝国を逃走、ベケットの盗賊団に参加した
その後反乱同盟軍に参加し帝国を滅ぼす
ハンの死後はレイと行動を共にした

ベン・ソロ
/
カイロ・レン(Ben
Solo
/
Kylo
Ren)
ソロとレイアの息子
祖父にあたるダース・ベイダーに惹かれたためルークに鍛えられるが、スノークに誘惑され、ルークに暗殺されかけたのも影響しダークサイドに転落
スノークを殺害しレイを誘ってファースト・オーダーを率いようとするが拒絶された
感情に任せルークの幻影と戦闘、レジスタンスを取り逃してしまう
その後ファースト・オーダーの最高指導者となったが、レイや両親の働きかけが効きライト・サイドへ帰還
蘇ったダース・シディアス、シス、ファースト・オーダーの後継組織ファイナル・オーダーをレイとともに葬り、フォースを使い果たし息絶えた

スター・ウォーズシリーズ_chunk13

劇中用語
基本的な用語のみ記述する
その他の用語、及び詳細は「用語一覧」「登場兵器一覧」「登場テクノロジー一覧」「惑星一覧」「戦いの一覧」を参照

フォース
銀河の万物をあまねく包み込んでいるエネルギー体
目には見えない中国の気のような概念だが、強い意思と精神集中によってその「流れ」を感じ取り自由に操作することで、身体能力や空間認識能力の強化に留まらず、未来予知、念力、心理操作、テレパシーなどの超感覚的な能力による現象を起こすことができる
使用者の感情に伴って性質は二つに別れ、ジェダイは穏やかで冷静な心から引き出される「ライトサイド(光明面)」、シスは怒りや憎しみといった負の感情によって引き出される「ダークサイド(暗黒面)」を用いる
初公開時の字幕スーパーでは、「理力」と訳されていた
(例:「機械に頼るな
理力を使え!」)
ライトセーバー
プラズマの光刃を形成する剣型の武器
主にジェダイとシスが接近戦で用いる
何らかの物体に接触すれば膨大な熱エネルギーを放出し、溶断する
レーザーやビームの類を跳ね返すこともできる
基本的にジェダイの光刃は青や緑、シスは真紅であるのが通例である

ジェダイ
作中では、「ジェダイの騎士/ジェダイ・ナイト」とも呼ばれる
フォースのライトサイドを駆使して戦う、銀河系の自由と正義の守護者たち
清廉潔白かつ気高い精神が求められ、恋愛の禁止、無抵抗な者への攻撃の禁止など、教条主義的な厳しい掟がある
人間性を排した体質に憤慨し、シスに寝返ったアナキンによって銀河共和国もろとも滅ぼされてしまうが、結果として、ルークという全く新しいジェダイが誕生することになる

スター・ウォーズシリーズ_chunk14

シス
作中では、「シスの暗黒卿」とも呼ばれる
フォースのダークサイドを信奉する者達の総称
ジェダイと相反する存在であり、欲望を貫徹させる精神的解放性とあからさまな権力欲を持ち、防御よりも攻撃を重視する傾向にある
シスとなった者は、それまでの名を捨て「ダース」(Dark
Lord
of
the
Sithの略称)の称号を冠する

ドロイド
人間と同程度か、それ以上の知性(特に専門分野では)を持つロボット全般を指す
基本的に与えられたプログラムに従って行動するが、長い稼動時間の中で経験や知識を積むことにより個性を得て自己主張し、更には嘘をついたり怒ったり喜んだりといった、極めて「人間的な」行動を見せるものも少なくない

クローン・トルーパー
“銀河一の賞金稼ぎ”ジャンゴ・フェットの遺伝子を元に、独立心や自我を削ぐ遺伝子調整を施され、成長速度を速めて生産された銀河共和国軍のクローン兵士
総兵力約320万ユニット
バトル・ドロイドを凌駕する戦闘能力により、クローン戦争における共和国の主力軍隊となった
ジェダイと任務を共にしたことで多くのクローンに個性が芽生え、ジェダイとの間にも強い絆が生まれた
しかし、その生産過程には密かにシスの関与があり、結果的にはクローン戦争終盤にジェダイが滅ぼされる一因となった
後の銀河帝国軍のストームトルーパーの前身でもある
銀河帝国誕生から10年以内にほぼ全ユニットが退役となった

ストームトルーパー
帝国に忠誠を誓い、絶対的に服従する銀河帝国軍の機動歩兵
総兵力20億ユニットともいわれている
サバイバル装備や温度調節機能を備えた白いアーマーに身を包み、ブラスターにより集団攻撃で敵を圧倒する
初期にはクローンによって構成されたが、まもなく士官学校から充当された人間によって構成されるようになり、銀河帝国誕生から10年後までには一般的な人間の男女でほぼ構成されるようになる
スノートルーパーやスカウト・トルーパーなど、任務に応じた様々なバリエーションが存在する
銀河帝国の崩壊後はストームトルーパーの動員も禁止されたが、残党勢力が密かに部隊を保持し続け、後にファースト・オーダーが台頭した際には、フォルムを一新した新世代のストームトルーパーが構成された

スター・ウォーズシリーズ_chunk15

評価
興行成績
批評家の反応
受賞
アカデミー賞
実写映画11作品を合わせると、アカデミー賞37部門にノミネートされ、そのうち7部門を受賞している
また、特別業績賞も計3回受賞している
『帝国の逆襲』と『ジェダイの帰還』は視覚効果で特別功労賞を受賞し、『スター・ウォーズ』はエイリアン、クリーチャー、ロボットの声で特別功労賞を受賞した

スター・ウォーズシリーズ_chunk16

その他メディア
本シリーズは、多種多様な媒体を通じて沢山のスピンオフ(外伝)を世に送り出してきた
ジョージ・ルーカス自身が他の作家による二次創作に寛容だったこともあり、映画本編と整合性が取られていない独創的な作品も多く存在する
しかし2012年にウォルト・ディズニー・カンパニーがルーカスフィルムを買収した際、膨大な数のスピンオフが新規ファンに混乱を与えてしまうという配慮から、スピンオフ作品は全て「カノン(正史)」と「レジェンズ(非正史)」に分別されることとなった

「カノン」に属するスピンオフ作品は、ウォルト・ディズニー・カンパニーがルーカスフィルムの買収後に設立した「ルーカスフィルム
ストーリー・グループ」の監修を受けた作品が該当する
それ以外(及び、すでに展開を終了している作品)は全て「レジェンズ」としていわゆる“パラレルワールド”の扱いとなった
しかし、「レジェンズ」の所属になったキャラクターのスローン大提督が「カノン」のアニメーション『反乱者たち』に、同じくタグ&ビンクが「カノン」の実写映画『ハン・ソロ』にそれぞれ登場しており、ルーカスフィルムのリーランド・チーは今後も「レジェンズ」のキャラクターが「カノン」に登場していくことを明言している

感想

おおむねいい感じに分割できてました。
たまに文字数が少ないチャンクがあるのですが、そういったのはそもそもデータとして不要だったりするので削除しちゃって良いかと思います。

この手法がどのドキュメントにも該当するというわけではないのですが、一個の手法として覚えておくのはいいかと思います。

ヘッドウォータース

Discussion