HTTP/1.0 の世界

HTTPをデータの箱としてみると、4つの基本要素にフォーカスできる

メソッドとパス
ヘッダー
ボディ
ステータス

HTTPの歴史

HTTP は Web ブラウザとWeb サーバーが通信する時の手順とフォーマットをルール化したもの

1990年: HTTP/0.9
1996年: HTTP/1.0
1997年: HTTP/1.1
2015年: HTTP/2

最初のバージョン HTTP/0.9 は、HTML のドキュメントを要求して取得するだけのプロトコル

RFC は IETF という組織が中心となって維持管理している、通信の相互接続性を維持するために共通化された仕様書集。
Request For Commentは、「品質アップのためのご意見を広く世界から集める」という名目で仕様を公開することにした名残。

通信プロトコル(アルゴリズム)ではなく、ファイルタイプの種類(データ)などの共通情報は IANA が管理している。
通信のための規約ではなくブラウザに特化した機能の仕様策定は IETF から W3C (World Wide Webコンソーシアム)に移管された。
最近では策定のための議論の過程は W3C から分離した WHATWG という組織のもとで行われることも増えてきた。

HTTP0.9ではできなかったこと

1つのドキュメントを送る機能しかなかった
通信されるすべての内容はHTML文書であるという想定だったため、ダウンロードするコンテンツのフォーマットをサーバーから伝える手段がなかった
クライアント側から検索のリクエストを送る以外のリクエストを送信できなかった
新しい文章を送信したり、更新したり、削除することはできなかった

HTTP1.0の変更点

リクエスト時にメソッドが追加された(GET)
リクエスト時にHTTPバージョンが追加された(HTTP/1.0)
ヘッダーが追加された(Host、User-Agent、Accept)
レスポンスの先頭にHTTPバージョンと3桁のステータスが含まれるようになった
リクエストと同じ形式のヘッダーが含まれるようになった

ヘッダーをピックアップ
リクエスト

User-Agent
- クライアントが自分のアプリケーション名を入れるところ。
- ネット利用者が使用しているOS・ブラウザ
Referer
- サーバー側で参考にするための追加情報。クライアントがリクエストを送る時に見ていたページの URL を送る。ページの参照元をサーバーが参照するのに用いる。
Authorization
- 特別なクライアントにだけ通信を許可する際、認証情報をサーバーに伝える。RFC でいくつかの標準的な形式(Basic/Digest/Bearer)を定めているが、アマゾンウェブサービスや GitHub API など、ウェブサービス独自の表記を求められることもある

レスポンス

Content-Type
- ファイルの種類を指定。
- ここには MIME タイプと呼ばれる識別子を記述する。
Content-Length
- ボディのサイズ。
Content-Encoding
- 何らかの圧縮が行われた場合に圧縮形式を説明する
Date
- ドキュメントの日時

MIME タイプ

MIME タイプは、ファイルの種類を区別するための文字列で、電子メールのために作られた。
大項目 / 詳細という表記。

ニュースグループ

ニュースグループあるいは USENET と呼ばれる、記事を読んだり投稿するプラットフォーム。
HTTP はニュースグループから、メソッドとステータスという 2 つの機能を導入した。

ステータス

ステータスも、ニュースグループから持ち込まれた機能の 1 つ。

100番台
- 処理中の情報の伝達。1xx 系は特殊な用途で使う。
200 番台
- 成功時のレスポンス。一番使用されるステータスは200 OKで、正常終了
300 番台
- サーバーからクライアントへの命令。エラーではなく、正常処理の範疇。リダイレクトや、キャッシュの利用を指示
400 番台
- クライアントから送られたリクエストにおかしなことがある場合に渡される
500 番台
- サーバー内部でエラーが発生した場合にクライアントに送付される

RFC の規約では、先頭 3 文字の数値を見てクライアントが動作を変更できることを求めている。これは言い換えれば「先頭三文字の数値は機械的に解釈できるものであるべきで、残りのテキスト部分はそれを見るユーザーのためのもの」という意味。

リダイレクト

300 番台のステータスの一部は、サーバーがブラウザに対して、リダイレクトを行うように指示するステータス。

リダイレクトはブラウザとの協調動作で実現されており、サーバーはステータスと Location ヘッダーを返す。ブラウザはそれを見て、もう一度、そのヘッダーで指定された URL にリクエストし直す。
この再送信のところはユーザーから見れば一瞬で行われるため、ブラウザの URL 表示だけがぱっと書き換わったように見える。

恒久的か一時的かは、移動する前のページが今後も存在するかどうかで分類している。
新しいドメインを取得してサーバーのコンテンツを移動した場合や、HTTP で運用されていたページを HTTPS に移行した場合、これまでのページを見ることはない。これは恒久的なリダイレクト。

メンテナンス期間の間だけすべてのリクエストをメンテナンス画面にリダイレクトするケースでは、将来的には復旧して有効になるはずなので、一時的リダイレクト。

URL(Uniform Resource Locators)

URI と URL はよく混同されるが、 URIにはURN(Uniform Resource Name)という、名前の付け方のルールも含まれている。

URLは場所からドキュメントなどのリソースを特定する手段を提供する。

URL の構造

スキーム :// ホスト名 / パス

ポート省略時はそれぞれのスキームごとのデフォルトのポートを使う。HTTP であれば 80 番。HTTPS であれば 443 番。

URL はアドレスを指定するのに使いますが、同時に「ユーザーが読む文章」でもある。

意味のあるURLにすることは、ブラウザを使ってウェブにアクセスするユーザーだけではなく、 HTTP を使ったウェブの API を利用するプログラマーから見ても、プログラムが分かりやすくなるメリットがある。

ボディ

通常、GET メソッド時に属性を送信する場合は、URL に付与したクエリー文字列を使って渡す。

サーバーはメッセージボディを読み込める必要はあるが、リクエストされたメソッドがボディのセマンティクスを定めていない場合は、リクエストの処理時にメッセージボディは無視されるべき(SHOULD be ignored)

ytaisei（たいせー）

HTTP/1.0 のセマンティクス

シンプルなフォームの送信

Content-Type: application/ x-www-form-urlencodedを設定する。
この場合、ボディは次のような形式になります。キーと値がイコールで接続され、各項目が &で繋がれた文字列になる。
しかし、区切り文字の & と = があっても、そのまま繋いでしまうため、読み込み側で正しく元のデータセットを復元できない。
ラウザは、RFC1866が定める変換フォーマットに従って文字列を変換する。このフォーマットでは、アルファベット、数値、アスタリスク、ハイフン、ピリオド、アンダースコアの 6 種類の文字以外はエスケープが必要。
実際に区切りとして使われる文字は変換されないため、読み込む側では正しく分解できる。
この方式をURL エンコードという。

HTML のフォームでは、オプションでマルチパートフォーム形式というエンコードタイプを選択できる。
通常の HTTP のレスポンスは一度に 1 ファイルずつ返すため、空行を見つけて、そこから Content- Length で指定されたバイト数分を読むだけでデータをまるごと取得できた。
しかし、マルチパートを使う場合は 1 度のリクエストで複数のファイルを送信できるため、受け取り側でファイルを区切らなければ行けない。
multipart/form-data の場合は、項目ごとに、追加のメタ情報をタグとして持てる。
x-www-form-urlencoded ではファイル送信に必要な情報すべてを送ることができず、ファイル名だけが送信されてしまう。

300 番台のステータスを使ったリダイレクトにはいくつかの制限がある。

URLには2000文字に収めるべき、という目安があるので、 GET のクエリーで送信できるデータ量に限界がある
データがURLに含まれるため、送信したい内容がアクセスログなどに残ってしまう懸念がある

それを回避する方法としてたまに利用されるのが、HTML のフォームを利用したリダイレクト
この方法では、リダイレクト先に送りたいデータが<input type="hidden">タグで書き込まれている HTML がサーバーから返ってくる。

通信方法を最適化するために、ひとつのクエストの中でサーバーとクライアントがお互いのベストな設定を共有する仕組みがコンテントネゴシエーション。

圧縮による通信速度の向上

現在一般的に使われている圧縮アルゴリズムを使うと、テキストファイルであれば 1/10 程度のサイズに圧縮できる。
圧縮と展開は、通信にかかる時間よりも少ない時間で行えるため、圧縮を利用することでウェブページ表示までにかかるトータルの処理時間を減らすことができる。
コンテンツ圧縮を行うネゴシエーションはすべて HTTP のヘッダーの中だけで完了する。なお、コンテンツのデータ量を表す Content-Length ヘッダーは、圧縮後のファイルサイズになる。

クッキー

クッキーは、ウェブサイトの情報をブラウザ側に保存する仕組み。
クッキーも HTTP のヘッダーをインフラとして実装されている。

クッキーの分類

クッキーの発行元、使用期間、および目的の 3 種類のカテゴリーで分類できる

発行元
- ユーザーが訪れたサイト(ファーストパーティ)か、それ以外のサイト(サードパーティ)か
使用期間
- ブラウザを閉じたら消えてしまうセッションクッキーと、期限が設定されていてブラウザを閉じても残る永続クッキー
目的
- 厳密に必要なクッキー。EC サイトで買い物など。
- 環境設定クッキー。過去に選択したユーザーの好みの言語、ユーザー名とパスワードなど
- 統計クッキー。アクセスしたページやクリックしたリンクなど、ウェブサイトの分析情報を収集するためのクッキー
- マーケティングクッキー。ユーザーの行動をトラッキングして、広告の精度を上げたり、広告
  の表示回数をコントロール

クッキーの間違った使い方

永続性の問題
- 無くなっても問題のない情報、もしくはサーバー側の情報から復元できるデータ以外を格納する用途には向かない
データサイズの問題
- リクエスト時にはヘッダーとして通信に常に付与されるため、通信量が増える
- 目安として最大容量は約 4 キロバイト、ドメインごとに 50 クッキー、全部で 3000 クッキーほどはブラウザは保存できるように実装すべきと RFC6265 には書かれている
セキュリティの問題
- secureを付与すれば HTTPS で暗号化された時にしか送受信されませんが、HTTP の場合クッキーは平文で送受信される

クッキーに制約をあたえる

クライアントは、サーバーから受け取ったクッキーをローカルのストレージに保存し、同じ URL にアクセスするときにはそのクッキーを読み出してサーバーへ送信するリクエストヘッダーに加える。
HTTP クライアントには、これらの属性を解釈し、クッキーの送信をコントロールする責務がある。

Expires、Max-Age 属性
- クッキーの寿命を設定する。Max-Ageは秒で指定。現在時刻から指定された秒数を足した時間に無効になる。
Domain 属性
- クライアントからクッキーを送信する対象のサーバー
- 省略時はクッキーを発行したサーバーになる
Path 属性
- クライアントからクッキーを送信する対象のサーバーのパス
Secure 属性
- HTTPS での安全な接続時以外は、クライアントからサーバーへのクッキー送信をしない。
- Secure 属性をつけることで、HTTP 接続が使われる時にはブラウザが警告を出し、ページヘのアクセスを止めるため、流出を防げるようになる
HttpOnly 属性
- この属性を付けると JavaScript エンジンから、クッキーを隠すことができる
SameSite 属性
- 同じオリジンのドメインに対して送信するようになる

オリジン

ブラウザは「スキーム、ドメイン(ホスト名)、ポート」の 3 つの組が同じであれば同一のサイトと判断する。
クッキーに関しては、デフォルトでオリジン単位で取り扱われますが、パスの階層でフィルタしたり、サブドメインも有効にするなど少しは変更できる。

SameSite 属性

クッキーはオリジンがマッチするときに送信されますが、攻撃者によって乗っ取られたウェブサイトからのアクセスであっても、ブラウザはそれを判別することなくクッキーを送信してしまいまう。

認証とセッション

認証、つまりユーザー名とパスワードを入れてログインすることで、サービス側から、誰がアクセスしてきているのかを特定できる。

BASIC 認証と Digest 認証

BASIC認証
- ユーザー名とパスワードを、base64 エンコーディングしたもの
- base64 エンコーディングは可逆変換であるため、サーバーで復元して元のユーザー名とパスワードを取り出すことができる
- これをサーバー側のデータベースと比較して、正しいユーザーかどうかを検証
- ただし、SSL/TLS 通信を使っていない状態で通信を傍受されると、通信内容から簡単にユーザー名とパスワードが漏洩してしまう
Digest 認証
- ハッシュ関数(A → B は簡単に行えるが、B → A は単純には計算できない)を利用
- ラウザが保護された領域にアクセスしようとすると、401 Unauthorizedというステータスでレスポンスが帰る
- ユーザー名とパスワードそのものをリクエストに含めなくても、サーバー側でユーザーを正しく認証できるようになる

BASIC 認証も Digest 認証も今ではあまり使われていない。

特定のフォルダ以下を「見せない」という使い方しかできず、トップページにユーザー固有の情報を出すようなことができない。
リクエストごとにユーザー名とパスワードを送信し、計算をして認証する必要がある。
ログイン画面をカスタマイズできない。
明示的なログオフができない
ログインした端末の識別ができない。

最近もっとも使われているのが、フォームを使ったログインとクッキーを使ったセッション管理の組み合わせ

クライアントは、フォームでIDとパスワードを送信
Digest認証とは異なりユーザー IDとパスワードを直接送信することになるため、SSL/TLSの利用が必須
サーバー側ではユーザー ID とパスワードで認証し、問題がなければセッショントークンを発行
サーバーは、セッショントークンをリレーショナル・データベースやキーバリュー型のデータベースに保存
トークンはクッキーとしてクライアントに戻される
2 度目以降のアクセスでは、クッキーを再送することで、ログイン済みのクライアントであることがサーバーに分かる

プロキシ

プロキシは、HTTP などの通信を中継する仕組み。
外部からの攻撃から保護するファイアウォールとしての役割もある。
また、低速な通信回線用にデータを圧縮して高速化する(画像の見た目等は劣化する)フィルタや、コンテンツのフィルタリング等にも利用される。
プロキシを実現する仕組みは単純で、GET 等のメソッドの次に来るパス名の形式だけが変わる。
中継されるプロキシは途中のホストの IP アドレスを特定のヘッダーに記録していく。

キャッシュ

すでにダウンロード済みで、内容に変化がなければダウンロードを抑制し、それによってパフォーマンスをあげるメカニズム。
キャッシュにはブラウザ上のキャッシュと、ウェブサービスとブラウザの間にたって動作するプロキシサーバーあるいは CDN(Content Delivery Network)と大きく2種類。
HTTP/1.1 を定義した RFC2068 では、永遠に更新しないことが期待されるコンテンツでも、最大で 1 年の寿命にしましょう、というガイドラインが追加されている。

リファラー

リファラー(ヘッダー名 :Referer)は、ユーザーがどの経路からウェブサイトに到達したかをサーバーが把握するために、クライアントがサーバーに送るヘッダー。
ウェブサービスの設計者は、プライバシーに関わる情報が GET パラメータとして表示されるような仕様を作成しては行けない。
GET パラメータは、リファラーを通じて外部のサービスに送信されるので、プライバシー情報の流出につながる。
リファラーを送信しないようにウェブブラウザを設定することも可能。

検索エンジン向けのコンテンツのアクセス制御

クローラー向けのアクセス制御の方法として、主に 2 つの手法が広く使われている。

robots.txt
- サーバーのコンテンツ提供者が、クローラーに対してアクセスの許可・不許可を伝えるためのプロトコル
サイトマップ
- ウェブサイトに含まれるページ一覧とそのメタデータを提供する XML ファイル

ユーザーエージェント

ウェブの世界においてはブラウザなどの通信を代行するプログラムのことをユーザーエージェントと呼ぶ。

ytaisei（たいせー）

Go 言語による HTTP/1.0 クライアントの実装

GET メソッドの送信と、ボディ、ステータス、ヘッダーの受信

io.Reader

Go 言語では、データのシーケンシャルなデータの入出力を io.Reader、io.Writerインタフェースとして抽象化しており、ファイル、ソケットなどさまざまなところで使用される。

func ioutil.ReadAll(reader io.Reader) ([]byte, error)
io.Readerの内容をまとめてバイト配列に読み込む
func Copy(dst io.Writer, src io.Reader) (written int64, err error)
io.Reader から io.Writer にまるごとコピー
fmt.Fprintf(writer io.Writer, format string, ... variant{})
フォーマット付き文字列を io.Writerに書き出し

GET メソッド + クエリーの送信

クエリー文字列は、url.Values型を使って宣言
values. Encode()を呼んで文字列に

HEAD メソッドでヘッダーを取得

ytaisei（たいせー）

HTTP/1.1 のシンタックス: 高速化と安全性を求めた拡張

HTTP/1.1 の、プロトコルシンタックスとしての変更点は次の通り

通信の高速化
- Keep-Aliveがデフォルトで有効に
TLSによる暗号化通信のサポート
新メソッドの追加
- PUTとDELETEが必須のメソッドとなった
- OPTION、TRACE、CONNECTメソッドが追加
プロトコルのアップグレード
名前を使ったバーチャルホストのサポート
サイズが事前にわからないコンテンツのチャンク転送エンコーディングのサポート
DATA URIスキーム

Keep-Alive による通信の高速化

Keep-Alive は、HTTP の下のレイヤーである TCP/IP の通信を効率化する仕組み

Keep-Alive を使わない場合は、ひとつのリクエストごとに通信を閉じます。Keep-Alive を使うと連続したリクエストの時に接続を再利用します。

Keep-Alive の持続時間は、クライアントとサーバーの両方が持っています。片方が TCP/IP の切断を行った瞬間に通信が完了するため、どちらか短い方が採用されます。

パイプライニング

パイプライニングは最初のリクエストが完了する前に次のリクエストを送信し、「レスポンスを待って次のリクエストを出す」までの待ち時間を排除することでネットワークの稼働率を上げ、パフォーマンスを向上させる機能

パイプラインは無駄な仕様だったというわけではなく、さまざまな問題を解決し、後の HTTP/2 においてストリームという新しい仕組みとして生まれ変わりました。

TLS(トランスポート・レイヤー・セキュリティ)

HTTPのウェルノウンポートは80番ですが、HTTPS(HTTP Secure)は443番を使い、別のサービスとして扱われています。

HTTP の通信を途中で中継するゲートウェイから見ると「暗号化されていて通信の内容を覗いたり変更ができない双方向通信」です。

ハッシュ関数

同じアルゴリズムと同じ入力データであれば、結果として作られるハッシュ値は同じになる。h(A) = Xが常に成り立つ
同一ハッシュ値を持つ任意のデータの組を見つけるのが難しい。h(A) = h(B)となる任意のデータの組 A と B を見つけるのは困難( 強衝突耐性 )

共通鍵暗号と公開鍵暗号とデジタル署名

暗号のアルゴリズムで大事だとされていることは、アルゴリズムそのものを秘密にするのではなく、アルゴリズムが公開されていても安全に通信できること

TLS で使われているものには、共通鍵方式と、公開鍵方式の 2 種類があります。

共通鍵方式は、鍵をかけるのと鍵をあけるのに同じ鍵を使う方式

鍵交換

DH(ディフィー・ヘルマン)鍵交換アルゴリズムのポイントとしては、鍵そのものを交換せず、クライアントとサーバーでそれぞれ鍵の材料を作り、お互いに交換しあって、それぞれの場所で計算して同じ鍵を得ます。

共通鍵方式と公開鍵方式を使い分ける理由

TLS では通信ごとに一度だけ使われる共通鍵を作り出し、公開鍵方式を使って通信相手へ厳重に鍵を受け渡し、その後は共通鍵で高速に暗号化を行うという 2 段階の方式を利用しています。

公開鍵方式の方が安全性は高いのですが、鍵を持っていたとしても暗号化と復号化に必要な計算量が共通鍵方式に比べて大きすぎるため

TLS の通信手順

TLS の通信は大きく 3 つに分けることができます。

ハンドシェイクプロトコルと呼ばれる通信を確立するステップ。
次がレコードプロトコルと呼ばれる通信時のステップ。
最後が SessionTicket という仕組みを使った、再接続時の高速なハンドシェイクです。

プロトコルのアップグレード

HTTPからTLSを使った安全な通信へのアップグレード(TLS/1.0、TLS/1.1、TLS/1.2)
HTTPからWebSocketを使った双方向通信へのアップグレード(websocket)
HTTPからHTTP/2へのアップグレード(h2c)

チャンク

HTTP/1.1 からサポートされた新しいデータ表現に、全体を一括で送信するのではなく小分けにして送信するチャンク方式があります。

データ URI スキーム

データ URI スキームを利用すると、URI がデータの位置を表す識別子ではなく、データそのものになります。

このデータ URI スキーム形式の用途として一般的なのが、スタイルシートに画像をテキストとして埋め込む方法です。

ytaisei（たいせー）

HTTP/1.1 のセマンティクス: 広がる HTTP の用途

ファイルをダウンロードした後でローカルに保存

ブラウザがファイルをどのように処理するのか決めているのは、拡張子ではなくサーバーから送られてくる MIME タイプでした。

Content-Disposition ヘッダーの内容によって、ブラウザはこの動作を変更します。

XMLHttpRequest

XMLHttpRequest とブラウザの HTTP リクエストの違い

送受信時にHTMLの画面がフラッシュ(リロード)されない
メソッドとして、GETとPOST以外も送信できる
フォームの場合、キーと値が1:1になっている形式のデータしか送信できず、レスポンスはブラウ
ザで表示されてしまうがさまざまなフォーマットが送受信できる
いくつか、セキュリティのための制約がある(後述)

XMLHttpRequest のセキュリティ

XMLHttpRequest の機能は強力すぎるため、ウェブページに悪意のあるスクリプトが埋め込まれると、認証されているウェブサイトへの通信が行われて、ブラウザ利用者の意図しないデータ改変が行われたり、データが奪われる危険があります。

XMLHttpRequest のセキュリティ制御は、アクセスできる情報の制限、送信制限という 2 つの制限から成り立っています。

WebDAV

WebDAVはHTTPを拡張することで分散ファイルシステムとして使えるようにしたものです。

ウェブサイト間で共通の認証・認可プラットフォーム

シングルサインオン

シングルサインオンは各システム間のアカウント管理をばらばらに行わず、一度サインインしたら、全システムがすべて有効になるような仕組みです。

Kerberos 認証

Kerberosで認証を行うと、チケット保証サーバー(TG)へのアクセストークンである、TGTTicket-Granting-Ticket)と、セッションキーが得られます。サービスやシステムを使う時には、TGTとセッションキーをチケット保証サーバー(TGS)に送り、クライアントからサーバーにアクセスするためのチケットと、セッションキーをもらいます。

SAML(Security Assertion Markup Language)

SAML はウェブ系の技術(HTTP / SOAP)を前提としたシングルサインオンの仕組みです。

SAML は XML ベースの規格を数多く手がけている OASIS(Organization for the Advancement of Structured Information Standards)で策定されている規格です

クッキーを使ってセッションを管理するウェブの仕組みに準じており、ドメインをまたいだサービス間でシングルサインオンできるようになっています。

ユーザー
- ブラウザを操作している人
認証プロバイダー(IdP)
- ID を管理するサービス
サービスプロバイダー(SP)
- ログインを必要とするサービス

まず事前準備として、認証プロバイダーにサービスの情報を登録します。

サービスのID(認証プロバイダーがサービスを識別するためのもの)
認証プロバイダーがHTTP-POSTする先のエンドポイントURL
バインディング(urn:oasis:names:tc:SAML:2.0:bindings:HTTP-POSTなど）
場合によってはX.509形式の公開鍵

サービスプロバイダー側にも認証プロバイダー情報を登録します。これも認証プロバイダーから XML ファイルが提供されています

SAML が面白い点は、事前に証明書などを交換してしまえば、すべてブラウザ経由のリダイレクトだけで済み、IdP と SP の直接通信がない点です。

OpenID

OpenID は、中央集権の ID 管理を行うのではなく、すでに登録されているウェブサービスのユーザー情報を使い、他のサービスにログインすることができる仕組みです。

OpenID プロバイダー
- ユーザー情報を持つウェブサービス。ユーザーはすでにこのサービスの ID を所有する。2017 年現在、Yahoo! JAPANとHatenaが対応している
リライングパーティー
- ユーザーが新たに利用したいウェブサービス
ユーザー入力識別子
- OpenID プロバイダーが提供する、ユーザーごとの URL 形式の文字列。OpenID プロバイダーのユーザープロフィール画面などに表示される。ユーザーを特定する ID ではなく、サービス名レベルの識別子が使われることもある

OAuth

OAuth は認証ではなく認可のための仕組みとして開発されました。

認可サーバー
- OpenID でいうところの OpenID プロバイダー。ユーザーは、この認可サーバーのアカウントを持っている
リソースサーバー
- ユーザーが許可した権限で自由にアクセスできる対象。Twitter や Facebook の場合は認可サーバーと同一
クライアント
- OpenID でいうところのリライングパーティー。ユーザーがこれから使用するサービスやアプリケーション。OpenID とは異なり、認可サーバーにアプリケーション情報を登録し、専用の ID(client_id と client_secret)を取得しておく必要がある。この ID はクレデンシャルと呼ばれることがある

OpenID Connect

OpenID Connectは、OAuth 2.0をベースにして、認可だけではなく、認証として使っても問題ないように拡張したものです。

クライアントから見たOAuth 2.0との違いは、ユーザープロフィールへのアクセス方法が規格化されたことです。

JWT(JSON Web Token)

JWT は 3 つの base64 エンコードされた文字列を、ピリオドで接合した文字列です。それぞれ、ヘッダー、ペイロード、署名となっています。

JWT の場合、「ログインした」実績情報と、ログインしたユーザーの詳細情報の両方が含まれます。検証ができてしまえば、ペイロードに入っている情報であれば認証サービスに問い合わせずに、ユーザーの情報が取得できます。これが JWT トークンが一番便利なところです。

ytaisei（たいせー）

Go 言語によるHTTP1.1 クライアントの実装

Keep-Alive

ソケットという1 本のパイプを時間分割で共有する仕組みなので、最後まで読みきって終了したことを明示しなければ、次のジョブをいつ使い始めればいいのか判断できずに再利用できません。

TLS

URL を https:// にするだけで標準ライブラリを使った TLS 通信が可能です。

証明書の作成

デフォルトではシステムが持っている証明書を使って証明書を確認します。

OpenSSLコマンドを使って秘密鍵ファイルを作る
証明書要求ファイルを作る
証明書要求ファイルに署名して証明書ができる

チャンク

http.Postで 2048 バイト以上のファイルを送信する場合で、Request.ContentLengthを設定せずに送信する場合に自動でチャンク形式でのアップロードになります。

リモートプロシージャコール(RPC)

ytaisei（たいせー）

HTTP/2、HTTP/3 のシンタックス:プロトコルの再定義

HTTP/2、HTTP/3 で変わらないこと

単純な機能の漸進的な修正ではなく、すべての要素が一度分解されて、大量のアセットが必要な時代の要件に合致するようにゼロから組み上げられました。

通信のオーバーヘッドを小さくするためにバイナリプロトコルとなり、HTTP の特性に合わせたヘッダー圧縮などが組み込まれました。また、その下の TCP のレイヤーで行っていることをエミュレーションしたり、高度な制御機構を取り込みました。

なお、HTTP/2 が出てきたからといって、HTTP/1.1 が不要になるわけではなく、HTTP/3 が出てき
たからといって、HTTP/2 が不要になるわけではありません。TCP しか使えない環境で最速を求める場合には HTTP/2 になるでしょう。

大規模なウェブシステムを作るとして、ロードバランサーなどのエッジまでは TLS の暗号化を使った通信になりますが、その中のロードバランサーの内側は TLS を使わない通信を使います。そうなると HTTP/1.1 となります。

HTTP/2

HTTP/2 は久々の大きなアップデートで、パフォーマンス向上にフォーカスしています。プロトコルをどのようなバイト列として表現して通信するかが大きく変わりました。

SPDY

SPDY は Google が開発した HTTP 代替のプロトコルで、これがほぼそのまま HTTP/2 となりました。

Google が SPDY を開発したのは、これまでの HTTP が改善してきた転送速度を一段と向上させるためです。

「ウェブサイトの JavaScript や CSS、画像などはなるべく少ないファイル数にまとめることで高速化させる」というのが HTTP/1.1 時代に高速なウェブサイトを作るためのテクニックとして一般的でした。

SPDY と HTTP/2 以降、ファイルをまとめる効果は小さくなることが見込まれています。

HTTP/2 の改善点

ストリームを使ってバイナリデータを多重に送受信する仕組みに変更
ストリーム内での優先順位設定や、サーバーサイドからデータ通信を行うサーバーサイドプッシュを実装
ヘッダーが圧縮されるようになった

HTTP/2 では、これまで手が付けられてこなかったヘッダー部の圧縮や、規格化されたもののいまひとつ活用されていなかったパイプライニングの代替実装が追加されました。

ストリームによる通信の高速化

HTTP/2 の一番大きな変化は、テキストベースのプロトコルからバイナリベースへのプロトコルに変化したという点です。各データはフレームと呼ばれる単位で送受信が行われます。

HTTP/2 では 1 本の TCP 接続の内部に、ストリームという仮想の TCP ソケットを作って通信を行います

HTTP/2 のアプリケーション層

HTTP/1.1 はテキストプロトコルでした。ヘッダーの終端を探すには空行を見つけるまで 1 バイトずつ読みこんで発見する必要があります。エラー処理などもあるため、サーバーとしてはパースまで含めて逐次処理せざるを得ず、高度な並列化は難しいと思われます。

HTTP/2 はバイナリ化されており、レスポンスの先頭にフレームサイズが入っています。TCP ソケットのレイヤーでは、データをフレーム単位へと簡単に切り分けられるため、受信側の TCP ソケットのバッファをすばやく空にでき、通信相手に対しても次のデータを高速にリクエストできるようになります。

フローコントロール

HTTP/2 はインターネットの 4 階層モデルのうちのアプリケーション層に当たるものですが、トランスポート層に近いものを内部に持っているのが特徴です。

フローコントロールは、ストリームを効率よく流すために用いられる通信量の制御処理です。

通信速度差がありすぎる機器の組み合わせで通信するときに、速い方の機器が遅い方に大量のパケットを送りつけて処理できなくなるような事態を防ぐのが目的です。

サーバープッシュ

サーバープッシュによって、クライアントから要求される前に優先度の高いコンテンツを送信できるようになりました。

HTTP/2 とプリロードによるリソース取得の最適化

一番効果が大きいのはサーバープッシュです。これはリクエストが発生する前に送信を開始するため、もっとも効果が高くなります。クライアント側からサーバーに対してリクエストを行う通信が 1 つ省略されるからです。

これらを先行して行うように、<link>タグや Linkヘッダーを使って指示できます。
これらのタグと、あとで説明する prerender は、リソースヒントという仕様にまとまっています

<link rel="preconnect" href="//cdn.example.com" crossorigin>

プリロードが効果的に働くのは、CSS の中で定義されているウェブフォントなどでしょう。CSS を読み込んで、CSS をパースして初めて必要なことがわかってサーバーにリクエストを送ってフォントファイルをロードします。リードタイムが伸びるのでフォントをプリロードしておくことには価値があります。

HPACK によるヘッダーの圧縮

ヘッダーは HPACK という方式で圧縮されます。世の中の圧縮アルゴリズムの多くは、データ圧縮時に、辞書と、辞書のキーの配列という 2 つのデータを作ります。同じ長い文が多ければ多いほど、辞書の項目は少なくなり、同じキーが何度も使われるようになって圧縮率が上がります。HPACK は普段使われるファイル圧縮のアルゴリズムと違い、事前に定義済みの辞書(静的テーブル)を持っています。

HTTP/3

QUIC

UDP は TCP から再送処理、輻輳制御などの高機能な機能を取り払い、初回接続時のネゴシエーションを軽くしたプロトコルです。

HTTP/3 のレイヤー

TCP の場合は、1 つのコネクション内のパケットがすべて整列されて転送されることを保証するプロトコルでした。QUIC は、セッションは張るものの、その中に複数の通信の疑似セッション(ストリーム) を張り、ストリームの内部では順序保証はするものの、ストリーム間での保証はしません。それにより、 1 つのストリームが失敗したときの影響が、他のストリームに及ばなくなります。

QUIC トランスポートプロトコルは、UDP を元にして、再送処理、輻輳制御、暗号化などを実装したものになります。大雑把にいってしまうと、TCP と TLS のレイヤーの置き換えです。

HTTP/3

HTTP/2 と比較すると、QUIC トランスポート側と、HTTP/3 とに分かれたため、HTTP/3 側はシンプルになっています。
全体的な違いとしては

ストリームIDのビット数が31から62に増えてオーバーフローの危険性がかなり減った
各フレームはストリームIDとフラグを持たなくなった
フラグによって増減するフィールドがなくなった
ヘッダー圧縮のアルゴリズムが、HPACKから、QPACKという別の方式に変わった

新たな JavaScript 用の通信 API

Fetch API

XMLHttpRequestよりも、オリジンサーバー外へのアクセスなど、CORSの取扱いが制御しやすくなっている
JavaScriptのモダンな非同期処理の記述法であるPromiseに準拠している
キャッシュを制御できる
リダイレクトを制御できる
リファラーのポリシーを設定できる
Service Worker内から利用できる

Server-Sent Events

チャンク形式は、巨大なファイルコンテンツを小分けにして送信するための通信方式でした。このチャンク形式の「少しずつ送信」という特徴を応用して、サーバーから任意のタイミングでクライアントにイベントを通知できる機能を実現しています。

WebSocket

WebSocket はサーバー/クライアント間で、オーバーヘッドの小さい双方向通信を実現します。

HTTP ウェブプッシュ

HTTP ウェブプッシュは、ウェブサイトにスマートフォンアプリケーションのような通知機能を提供する仕組みです。

Service WorkerはフロントエンドのブラウザのHTML表示機能からすると、ウェブサーバーとフロントエンドの中間にある、プロキシサーバーのような存在です。ただし、Service Workerは常に起動し続けているわけではなく、addEventListener()イベントハンドラを登録しておくと、必要なときだけ起動して処理を行います。

ytaisei（たいせー）

HTTP/2 のセマンティクス: 新しいユースケース

セマンティックウェブ

セマンティックウェブで「意味を扱う」というのは、ページに含まれる情報を分析し、情報を集約したり探したりするのを人手を介さずに行えるようにすることです。

RDF(Resource Description Framework)

RDF は URI で識別されるエンティティ間の関係性を記述します。

RSS

RSSはウェブサイトの更新履歴のサマリーに関するボキャブラリーです。

ウェブサイトをブラウザで巡回しなくても、専用のリーダーが登録した RSS の更新チェックを行い、未読のエントリーを集めて効率よく閲覧できるようにしてくれます。

オープングラフプロトコル

オープングラフプロトコルはソーシャルネットワークで使われるメタデータで、ソーシャルネットワークでトップシェアを誇る Facebook が開発しました。

オープングラフプロトコルが設定されているウェブサイトの URL を SNS 等に貼り付けると、記事の一部が引用され、画像も表示されます。

単に URL だけが表示されるのと比較すると他のユーザーから興味をもってもらえるチャンスが増えます。

AMP(Accelerated Mobile Pages)

AMP はモバイルの高速化のための仕組みです。

現代のウェブサイトは、複雑な JavaScript を駆使して構築されています。それを平準化してモバイル専用の軽量なページを作る所が AMP の出発点です。

モバイルアプリケーションにより多様化するブラウズ環境

URL のような情報を元に、アプリケーションの特定の機能を呼び出せる仕組みが OS に加わり、ウェブからアプリケーションへのリンクのような形で動作します。方式自体は Android と iOS で多少異なりますが、このような仕組みをまとめて DeepLink と呼びます。

MPEG-DASH による動画ストリーミング再生

DASHはDynamic Adaptive Streaming over HTTPの頭文字を取った名前で、HTTPを使い、動的に適切なビットレートでストリーミングを行う方式を意味します。

ytaisei（たいせー）

Go言語によるHTTP/2、HTML 5 のプロトコルの実装

HTTP/2

Go言語は2016年2月にリリースされた1.6から、標準でHTTP/2サポートが組み込まれています。

ytaisei（たいせー）

クライアント視点で見るRESTful API

REST(REpresentational State Transfer)はRoy Fielding氏が2000年にネットワークベースのソフトウェアアーキテクチャの論文の中で発表したものです

REST は HTTP のシンタックスをプロトコルの土台として使っていますが、通信のセマンティクスも HTTP にならうようにしましょうという考えです。

APIがウェブサーバーを通じて提供されている
GET /users/[ユーザーID]/repositoriesのように、パスに対してメソッドを送ることでサービスを得る
APIの成功可否はステータスとしてクライアントに通知される
URLはリソースの場所を表す表現であり，サービスの顔として大切である
必要に応じて、GETパラメータ、POSTのボディなどの追加情報を送信することもある
サーバーからの返り値としては、JSONやXMLのような構造化テキスト、あるいは画像データなどが返ってくることが多い
URLはリソースの階層を表したパスになっている。名詞のみで構成されている
リソースに対して、HTTPメソッドを送ることでリソースの取得、更新、追加などの操作を行う
ステータスを見ればリクエストが正しく処理されたかどうかが判定できる
GETメソッドは何度呼んでも状態を変更することがない
クライアント側では管理すべきステートが存在せず、1回ごとのリクエストは独立して発行できる
トランザクションは存在しない

HATEOAS

HATEOAS(Hypermedia As The Engine Of Application Stat)はRESTの一部である「インタフェースの一般化」を仕様化したもの

リソース間の関連情報やリソースの操作のリンクをレスポンスに含めることで、リソースの自己記述力を向上させます

メソッド

HTTP の仕様ではメソッドの分類には、安全とべき等(とう)という 2 つの指標があります

安全は、実行してもリソースを変化させないもの

べき等はサーバーのリソースは変更されますが、何度実行しても結果が変わらないというもの

安全なものはべき等性も兼ね備えています

ytaisei（たいせー）

JavaScript によるブラウザからの動的な HTTP リクエスト

ブラウザの HTTP とライフサイクル

ブラウザがHTTPアクセスをする箇所は主に2箇所あります。ウェブサイトのロードと、その後 JavaScript を使ったアクセスです。

Fetch API

ウェブの進化は速度とセキュリティ向上という 2 つのベクトルによって発展してきましたが、Fetch API は後者にあたります。デフォルトでより厳格な設定が選択されており、必要に応じて明示的に解除するという設計になっています。

Fetch APIにしかできないこと

キャッシュの制御

Service Worker対応

Server-Sent Events

Server-Sent EventsはXMLHttpRequestやFetch APIとは異なり、サーバー側から通信を行うためのプロトコルおよび JavaScript の API です。

このスクラップは2023/07/08にクローズされました

HTTP/1.0 の世界

HTTPの歴史

MIME タイプ

ニュースグループ

ステータス

リダイレクト

URL(Uniform Resource Locators)

URL の構造

ボディ

HTTP/1.0 のセマンティクス

シンプルなフォームの送信

圧縮による通信速度の向上

クッキー

クッキーの分類

クッキーの間違った使い方

クッキーに制約をあたえる

オリジン

SameSite 属性

認証とセッション

BASIC 認証と Digest 認証

プロキシ

キャッシュ

リファラー

検索エンジン向けのコンテンツのアクセス制御

ユーザーエージェント

Go 言語による HTTP/1.0 クライアントの実装

GET メソッドの送信と、ボディ、ステータス、 ヘッダーの受信

io.Reader

GET メソッド + クエリーの送信

HEAD メソッドでヘッダーを取得

HTTP/1.1 のシンタックス: 高速化と安全性を求めた拡張

Keep-Alive による通信の高速化

パイプライニング

TLS(トランスポート・レイヤー・セキュリティ)

ハッシュ関数

共通鍵暗号と公開鍵暗号とデジタル署名

鍵交換

共通鍵方式と公開鍵方式を使い分ける理由

TLS の通信手順

プロトコルのアップグレード

チャンク

データ URI スキーム

HTTP/1.1 のセマンティクス: 広がる HTTP の用途

ファイルをダウンロードした後でローカルに保存

XMLHttpRequest

XMLHttpRequest とブラウザの HTTP リクエストの違い

XMLHttpRequest のセキュリティ

WebDAV

ウェブサイト間で共通の認証・認可プラットフォーム

シングルサインオン

Kerberos 認証

SAML(Security Assertion Markup Language)

OpenID

OAuth

OpenID Connect

JWT(JSON Web Token)

Go 言語によるHTTP1.1 クライアントの実装

Keep-Alive

TLS

証明書の作成

チャンク

リモートプロシージャコール(RPC)

HTTP/2、HTTP/3 の シンタックス:プロトコルの再定義

HTTP/2、HTTP/3 で変わらないこと

HTTP/2

SPDY

HTTP/2 の改善点

ストリームによる通信の高速化

HTTP/2 のアプリケーション層

フローコントロール

サーバープッシュ

HTTP/2 とプリロードによるリソース取得の最適化

HPACK によるヘッダーの圧縮

HTTP/3

QUIC

HTTP/3 のレイヤー

HTTP/3

新たな JavaScript 用の通信 API

Fetch API

Server-Sent Events

GET メソッドの送信と、ボディ、ステータス、ヘッダーの受信

HTTP/2、HTTP/3 のシンタックス:プロトコルの再定義

JavaScript によるブラウザからの動的な HTTP リクエスト