様々なCompletionToken
CompletionTokenとは
Boost.Asioのドキュメントには、以下のようにCompletion Tokensが説明されています。
さらに、
では、Completion Tokenの組み合わせて使える機能などが説明されています。2023年において、Completion Tokenと組み合わせて使うことの多い機能は、
- callback (extended)
- future
- stackless coroutine
- C++20 coroutines (stackful)
といったところかと思います。
ホスト名やIPアドレスからendpointを得るexample
Boost.Asioの機能に、ネットワーク接続の端点となるオブジェクト endpointを取得する機能があります。
ホスト名を名前解決してendpointを得たり、IPアドレスからendpointを得たりします。オンラインコンパイラのgodboltでは、ホスト名の解決が(おそらくセキュリティ上の都合で)できなかったので、IPアドレスからendpointを得る例を示します。
callback(extended)
コールバックは、最もシンプルなCompletionTokenの使い方です。
#include <iostream>
#include <boost/asio.hpp>
namespace as = boost::asio;
int main() {
as::io_context ioc;
as::ip::tcp::resolver r{ioc.get_executor()};
r.async_resolve(
"127.0.0.1",
"12345",
[&]
(
boost::system::error_code const& ec,
as::ip::tcp::resolver::results_type results
) {
std::cout << ec.message() << std::endl;
for (auto const& result : results) {
std::cout << result.endpoint() << std::endl;
}
}
);
ioc.run();
}
godboltでの実行:
async_resolveにhost, port, callbackの順で引数を渡しています。callbackはcallableなら何でも良いのですが、ここではラムダ式を渡しています。
async_resolveの仕様は以下を参照して下さい。
CompletionTokenは、async_resolveの場合は、ResolveTokenと呼ばれるようですが、意味は非同期処理完了時にinvokeされるCompletionTokenの一種です。
エラーコードecと、結果の集合resultsを引数で受け、結果をひとつひとつresultとして取り出し、そこから、endpointを取り出して表示しています。
callback(extended)と書いているのは、append()などの拡張が行えることを意味しています。
これに関しては
を参照していただければと思います。
以下に、56789という特に意味の無い値をappendした例を示します。
#include <iostream>
#include <boost/asio.hpp>
namespace as = boost::asio;
int main() {
as::io_context ioc;
as::ip::tcp::resolver r{ioc.get_executor()};
r.async_resolve(
"127.0.0.1",
"12345",
as::append(
[&]
(
boost::system::error_code const& ec,
as::ip::tcp::resolver::results_type results,
int append_val
) {
std::cout << ec.message() << std::endl;
for (auto const& result : results) {
std::cout << result.endpoint() << std::endl;
}
std::cout << "append_val:" << append_val << std::endl;
}, 56789
)
);
ioc.run();
}
godboltでの実行:
コールバックの引数の末尾にappend_valを追加し、そこに56789が渡されていることが確認できます。
callbackの欠点
callbackは、非同期処理の連鎖をラムダ式で書いた場合、どんどんネストが深くなっていき、コードの可読性が低下するという欠点があります。この状況はcallback hellなどと呼ばれることもあります。
では、コールバックを関数やメンバ関数にしたらどうでしょうか? ネストの問題は解決しますが、今度は、一連の非同期シーケンスを実行するためのコードが散らばってしまい、これはこれで可読性が低下するという欠点があります。
future
futureは、callbackの欠点を解決する手法のひとつとして使うことができます。
futureをつかったコードを以下に示します。
#include <iostream>
#include <boost/asio.hpp>
namespace as = boost::asio;
int main() {
as::io_context ioc;
auto guard = as::make_work_guard(ioc.get_executor());
std::thread th {
[&] {
ioc.run();
}
};
as::ip::tcp::resolver r{ioc.get_executor()};
std::future<
as::ip::tcp::resolver::results_type
> f = r.async_resolve(
"127.0.0.1",
"12345",
as::use_future
);
try {
auto const& results = f.get();
for (auto const& result : results) {
std::cout << result.endpoint() << std::endl;
}
}
catch (boost::system::system_error const& se) {
std::cout << se.what() << std::endl;
}
guard.reset();
th.join();
}
godboltでの実行:
as::io_context ioc;
auto guard = as::make_work_guard(ioc.get_executor());
std::thread th {
[&] {
ioc.run();
}
};
まず、冒頭で、非同期処理実行用のthreadを準備します。そしてそのthreadの中で、ioc.run()を呼び出します。ただし、ioc.run()は非同期処理が登録されていない場合、すぐに抜けて終了してしまいます。これを避けるために、処理が登録されてなくてもioc.run()から抜けないようにするwork_guardというものを設定しています。
guard.reset();
th.join();
コードの末尾で、work_guardを外し、ioc.run()に処理が登録されていない状態になったら抜けるようにしています。そして直後にthreadをjoin()しています。これは、futureとasioを組み合わせて使う場合の定番コードといえるでしょう。
std::future<
as::ip::tcp::resolver::results_type
> f = r.async_resolve(
"127.0.0.1",
"12345",
as::use_future
);
futureを使うには、CompletionTokenとして、use_future
を渡します。すると、非同期関数async_resolve()
はfutureを戻り値として返すようになります。
futureの型はas::ip::tcp::resolver::results_type
です。
ここで、callbackの時の第1引数だったboost::system::error_code
はどこに行ったのか気になると思います。
実は、use_future
では、CompletionTokenの第1引数がboost::system::error_code
の場合にだけ、戻り値のfutureの型からそれを削除します。
そして、エラーコードは、エラー発生時にのみboost::system::system_error
というexceptionとして、futureをget()したときにthrowされるのです。
try {
auto const& results = f.get();
for (auto const& result : results) {
std::cout << result.endpoint() << std::endl;
}
}
catch (boost::system::system_error const& se) {
std::cout << se.what() << std::endl;
}
こういった理由から、上記のような、try catchの記述を行っています。
CompletionTokenの引数とfutureの型の対応例をいくつか挙げておきます。
CompletionTokenの引数 | futureの型 |
---|---|
boost::system::error_code, int | int |
boost::system::error_code, int, double | std::tuple<int, double> |
int | int |
boost::system::error_code, int, double, boost::system::error_code | std::tuple<int, double, boost::system::error_code> |
futureの欠点
futureは、非同期処理実行用のthreadを作る必要があるという欠点があります。また、その他の方法と比較すると、非同期処理完了時の情報の受け渡しにコストがかかります。
stackless coroutine
stackless coroutineに関しては、
で詳しく説明しているのでここではコードを示すに留めます。#include <iostream>
#include <boost/asio.hpp>
namespace as = boost::asio;
#include <boost/asio/yield.hpp>
template <typename Executor>
struct app {
app(Executor exe):r_{exe} {
impl_();
}
private:
friend struct impl;
struct impl {
impl(app& a):app_{a} {
}
void operator()() const {
proc({}, {});
}
void operator()(
boost::system::error_code const& ec,
as::ip::tcp::resolver::results_type results
) const {
proc(ec, std::move(results));
}
private:
void proc(
boost::system::error_code const& ec,
as::ip::tcp::resolver::results_type results
) const {
reenter(coro_) {
yield app_.r_.async_resolve(
"127.0.0.1",
"12345",
*this
);
std::cout << ec.message() << std::endl;
for (auto const& result : results) {
std::cout << result.endpoint() << std::endl;
}
}
}
app& app_;
mutable as::coroutine coro_;
};
impl impl_{*this};
as::ip::tcp::resolver r_;
};
#include <boost/asio/unyield.hpp>
int main() {
as::io_context ioc;
app a{ioc.get_executor()};
ioc.run();
}
godboltでの実行:
C++20 coroutine (stackful)
#include <iostream>
#include <boost/asio.hpp>
namespace as = boost::asio;
template <typename Executor>
as::awaitable<void>
app(Executor exe) {
as::ip::tcp::resolver r{exe};
try {
auto results = co_await r.async_resolve(
"127.0.0.1",
"12345",
as::use_awaitable
);
for (auto const& result : results) {
std::cout << result.endpoint() << std::endl;
}
}
catch (boost::system::system_error const& se) {
std::cout << se.what() << std::endl;
}
}
int main() {
as::io_context ioc;
as::co_spawn(ioc, app(ioc.get_executor()), as::detached);
ioc.run();
}
godboltでの実行:
C++20のcoroutineを使うには、C++20以上指定してコンパイルする必要があります。
coroutineを用いた非同期実行を司る関数をapp()としています。
その戻り値は、as::awaitable<void>
となっていて、この関数がcoroutineの実行用関数であることを示しています。
auto results = co_await r.async_resolve(
"127.0.0.1",
"12345",
as::use_awaitable
);
非同期関数async_resolve()の直前に、co_await
と記述することで、いったん処理がasync_resolveの内部での非同期実行に移り、非同期処理が完了したら戻ってきて、resultsに結果が入ります。あたかも同期処理のように非同期処理が記述できて便利です。
こちらも、戻り値のboost::system::error_code
が消えていますが、これはfutureの場合と同様に、エラー発生時は、boost::system::system_error
例外がthrowされるためです。
IPアドレスを"invalid host"にして、例外がthrowされることを確認してみます。
たしかに、例外がcatchされていますね。
4つのアプローチのパフォーマンス(推測を含む)
4つのアプローチで実行時間を測定してみました。
x86-64 clang 16.0.0 Compiler options: -std=c++20 -O3 -pthread
実行時引数に、内部ループの回数を与えます。godboltのリンクでは 300000 を渡しています。
基本的に、パフォーマンス測定は、クラウド環境に負荷をかけないようにローカルで行うべきです。
(godboltは一定時間を超えるとプロセスがkillされます。)
以下は私のローカル環境で、引数に1000000 (100万)を渡した結果です。
--- ---
callback :112ms // この値は、初回実行のため、何らかの(キャッシュとか?)ペナルティがありそうなので無視したい
callback :71ms
callback :70ms
slcoro :89ms
slcoro :66ms
slcoro :68ms
cpp20coro:138ms
cpp20coro:140ms
cpp20coro:137ms
future :7743ms
future :8189ms
future :8005ms
結果は下記のような感じになりました。
パフォーマンスの高い順です。実行時間で比較すると不等号が逆になります。
callback = stackless coroutine > C++20 coroutine >>> future
それぞれ2番目の測定結果をもとに、グラフにしてみました。
stackless coroutineは実際のところcallbackのメカニズムにswitch-caseによる、見かけ上の継続実行の仕組みを追加したものです。そのための条件判断コストがかかりますが、極めて小さなコストでしょう。C++20 coroutineは、stackfulなので、stackの情報を待避、復元させるなどの操作が必要かと思います。thread前提となるfutureはこれらと比較するとあきらかに遅いです。
Discussion