Python で文字列中の4バイト文字を消す

Python
2023-03-06 07:01 (2 years ago)
F0 Purge
この記事をテーマにした曲を再生

def remove_4bytes_char(text):
    """
    文字列から4バイト文字を消す
    """
    # 文字列を bytearray に変換
    byte_string = bytearray(text.encode('utf-8'))

    # バイト列から4バイトのUTF-8文字を除去する
    while b'\xf0' in byte_string:
        index = byte_string.index(b'\xf0')
        if index + 3 < len(byte_string):
            for _i in range(4):
                byte_string.pop(index)

    # bytearrayを文字列に変換
    return byte_string.decode('utf-8')
評価をお願いします
まだ評価がありません
著者は、アプリケーション開発会社 Cyberneura を運営しています。
開発相談をお待ちしています。

アーカイブ