全角英数字を半角に変換したい時、javascriptでは以下のようにします。
<div class="code-block-container"><pre class="language-js"><code class="language-js">str.replace(/[０-９ａ-ｚＡ-Ｚ]/g, function (s) {
 return String.fromCharCode(s.charCodeAt(0) - 0xfee0);
});
</code></pre></div>pythonで同じことをする方法を探していたら<code>Unicode正規化</code>という言葉を見付けました。
例えばzennでは<code>topics</code>を指定することができます。ユーザーによっては<code>python(半角)</code>を<code>ｐｙｔｈｏｎ(全角)</code>と書く人がいるかもしれません。そうなると<code>python(半角)</code>と<code>ｐｙｔｈｏｎ(全角)</code>は別のtopicsになってしまいます。
このような重複をなくすために<code>Unicode正規化</code>すると、ユーザーが入力した<code>ｐｙｔｈｏｎ(全角)</code>は<code>python(半角)</code>に修正されます。
<aside class="msg alert">!<div class="msg-content">
上記で意味がわからない表記になっていますが、zennの機能により全角のpythonは半角に変換(正規化)されているようです。
</div></aside>
そしてpythonの標準ライブラリである<code>unicodedata</code>を使うと簡単に正規化することができます。
<div class="code-block-container"><pre class="language-python"><code class="language-python">import unicodedata


s = "１２３①②③,㍻㍉㌦㎡㈱№,ａｂｃＡＢＣ,Å🅱©,123abcABC,＜＞,アイウエオｶｷｸｹｺ"
unicodedata.normalize("NFKC", s)

# '123123,平成ミリドルm2(株)No,abcABC,Å🅱©,123abcABC,&lt;&gt;,アイウエオカキクケコ'
</code></pre></div><table>
<thead>
<tr>
<th style="text-align:left">変換前</th>
<th style="text-align:left">変換後</th>
<th style="text-align:left">備考</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align:left">１２３①②③,</td>
<td style="text-align:left">123123</td>
<td style="text-align:left">全角数字と機種依存文字</td>
</tr>
<tr>
<td style="text-align:left">㍻㍉㌦㎡㈱№</td>
<td style="text-align:left">平成ミリドルm2(株)No</td>
<td style="text-align:left">機種依存文字</td>
</tr>
<tr>
<td style="text-align:left">ａｂｃＡＢＣ</td>
<td style="text-align:left">abcABC</td>
<td style="text-align:left">全角英字</td>
</tr>
<tr>
<td style="text-align:left">Å🅱©</td>
<td style="text-align:left">Å🅱©</td>
<td style="text-align:left">英字の記号</td>
</tr>
<tr>
<td style="text-align:left">123abcABC</td>
<td style="text-align:left">123abcABC</td>
<td style="text-align:left">半角英数字（変わらず）</td>
</tr>
<tr>
<td style="text-align:left">＜＞</td>
<td style="text-align:left">&lt;&gt;</td>
<td style="text-align:left">記号</td>
</tr>
<tr>
<td style="text-align:left">アイウエオｶｷｸｹｺ</td>
<td style="text-align:left">アイウエオカキクケコ</td>
<td style="text-align:left">カタカナ</td>
</tr>
</tbody>
</table>
全角英数字だけでなく、機種依存文字や括弧、半角カタカナも変換されています。
normalize関数の引数に指定した<code>NFKC</code>は正規化の形式で、以下4つから選べます。
<div class="code-block-container"><pre class="language-py"><code class="language-py">s = "１２３①②③,㍻㍉㌦㎡㈱№,ａｂｃＡＢＣ,Å🅱©,123abcABC,＜＞,アイウエオｶｷｸｹｺ"
[
 unicodedata.normalize("NFC", s),
 unicodedata.normalize("NFKC", s),
 unicodedata.normalize("NFD", s),
 unicodedata.normalize("NFKD", s),
]
</code></pre></div><div class="code-block-container"><pre class="language-bash"><code class="language-bash">['１２３①②③,㍻㍉㌦㎡㈱№,ａｂｃＡＢＣ,Å🅱©,123abcABC,＜＞,アイウエオｶｷｸｹｺ',
 '123123,平成ミリドルm2(株)No,abcABC,Å🅱©,123abcABC,&lt;&gt;,アイウエオカキクケコ',
 '１２３①②③,㍻㍉㌦㎡㈱№,ａｂｃＡＢＣ,Å🅱©,123abcABC,＜＞,アイウエオｶｷｸｹｺ',
 '123123,平成ミリドルm2(株)No,abcABC,Å🅱©,123abcABC,&lt;&gt;,アイウエオカキクケコ']
</code></pre></div><h2 id="%E5%8F%82%E8%80%83%E3%82%B5%E3%82%A4%E3%83%88">
<a class="header-anchor-link" href="#%E5%8F%82%E8%80%83%E3%82%B5%E3%82%A4%E3%83%88" aria-hidden="true"></a> 参考サイト</h2>
<a href="https://docs.python.org/ja/3/library/unicodedata.html" target="_blank" rel="nofollow noopener noreferrer">unicodedata --- Unicode データベース</a>
<a href="https://www.wikiwand.com/ja/Unicode%E6%AD%A3%E8%A6%8F%E5%8C%96" target="_blank" rel="nofollow noopener noreferrer">Unicode正規化 - Wikiwand</a>
<a href="http://nomenclator.la.coocan.jp/unicode/normalization.htm" target="_blank" rel="nofollow noopener noreferrer">Unicode正規化</a>
<a href="https://analytics-note.xyz/programming/unicode-normalization-forms/" target="_blank" rel="nofollow noopener noreferrer">正規化形式別のユニコード正規化の振る舞いの違いを見てみる | 分析ノート</a>

全角英数字を半角に変換

bilzard

C形式とD形式は見た目からは違いが分からないようです。 
以下のコードスニペットのようにバイナリで表現すると判別出来ました。 
（C形式はアクセント文字を1つの文字として保持しているのに対し、D形式は元の文字とアクセントの2文字として保持しているようです）
<div class="code-block-container"><pre class="language-python"><code class="language-python">import pandas as pd
import unicodedata as ud

df = pd.DataFrame({"text": ["é"]})
df["text"] = df["text"].apply(lambda x: ud.normalize("NFKD", x))
df["text"].apply(lambda x: x.encode()).head(1).item()
</code></pre></div><ul>
<li>NFKD -&gt; b'e\xcc\x81'</li>
<li>NFKC -&gt; b'\xc3\xa9'</li>
</ul>

Discussion