Python で文字列中の4バイト文字を消す

投稿者: ytyng 1年, 1ヶ月 前
def remove_4bytes_char(text):
    """
    文字列から4バイト文字を消す
    """
    # 文字列を bytearray に変換
    byte_string = bytearray(text.encode('utf-8'))

    # バイト列から4バイトのUTF-8文字を除去する
    while b'\xf0' in byte_string:
        index = byte_string.index(b'\xf0')
        if index + 3 < len(byte_string):
            for _i in range(4):
                byte_string.pop(index)

    # bytearrayを文字列に変換
    return byte_string.decode('utf-8')
現在未評価

コメント

アーカイブ

2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011