老熟女激烈的高潮_日韩一级黄色录像_亚洲1区2区3区视频_精品少妇一区二区三区在线播放_国产欧美日产久久_午夜福利精品导航凹凸

重慶分公司,新征程啟航

為企業(yè)提供網站建設、域名注冊、服務器等服務

怎么處理Python中字符編碼問題-創(chuàng)新互聯(lián)

創(chuàng)新互聯(lián)www.cdcxhl.cn八線動態(tài)BGP香港云服務器提供商,新人活動買多久送多久,劃算不套路!

成都創(chuàng)新互聯(lián)是工信部頒發(fā)資質IDC服務器商,為用戶提供優(yōu)質的成都溫江機房服務

怎么處理Python中字符編碼問題?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

Python中可以使用base64來處理字符編碼問題,Base64是一種用64個字符來表示任意二進制數(shù)據(jù)的方法。

用記事本打開exe、jpg、pdf這些文件時,我們都會看到一大堆亂碼,因為二進制文件包含很多無法顯示和打印的字符,所以,如果要讓記事本這樣的文本處理軟件能處理二進制數(shù)據(jù),就需要一個二進制到字符串的轉換方法。Base64是一種最常見的二進制編碼方法。

Base64的原理很簡單,首先,準備一個包含64個字符的數(shù)組:

['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']

然后,對二進制數(shù)據(jù)進行處理,每3個字節(jié)一組,一共是3x8=24bit,劃為4組,每組正好6個bit

這樣我們得到4個數(shù)字作為索引,然后查表,獲得相應的4個字符,就是編碼后的字符串。

所以,Base64編碼會把3字節(jié)的二進制數(shù)據(jù)編碼為4字節(jié)的文本數(shù)據(jù),長度增加33%,好處是編碼后的文本數(shù)據(jù)可以在郵件正文、網頁等直接顯示。

如果要編碼的二進制數(shù)據(jù)不是3的倍數(shù),最后會剩下1個或2個字節(jié)怎么辦?Base64用\x00字節(jié)在末尾補足后,再在編碼的末尾加上1個或2個=號,表示補了多少字節(jié),解碼的時候,會自動去掉。

Python內置的base64可以直接進行base64的編解碼:

>>> import base64
>>> base64.b64encode('binary\x00string')
'YmluYXJ5AHN0cmluZw=='
>>> base64.b64decode('YmluYXJ5AHN0cmluZw==')
'binary\x00string'

由于標準的Base64編碼后可能出現(xiàn)字符+和/,在URL中就不能直接作為參數(shù),所以又有一種"url safe"的base64編碼,其實就是把字符+和/分別變成-和_:

>>> base64.b64encode('i\xb7\x1d\xfb\xef\xff')
'abcd++//'
>>> base64.urlsafe_b64encode('i\xb7\x1d\xfb\xef\xff')
'abcd--__'
>>> base64.urlsafe_b64decode('abcd--__')
'i\xb7\x1d\xfb\xef\xff'

還可以自己定義64個字符的排列順序,這樣就可以自定義Base64編碼,不過,通常情況下完全沒有必要。

Base64是一種通過查表的編碼方法,不能用于加密,即使使用自定義的編碼表也不行。

Base64適用于小段內容的編碼,比如數(shù)字證書簽名、Cookie的內容等。

由于=字符也可能出現(xiàn)在Base64編碼中,但=用在URL、Cookie里面會造成歧義,所以,很多Base64編碼后會把=去掉:

# 標準Base64:
'abcd' -> 'YWJjZA=='
# 自動去掉=:
'abcd' -> 'YWJjZA'

去掉=后怎么解碼呢?因為Base64是把3個字節(jié)變?yōu)?個字節(jié),所以,Base64編碼的長度永遠是4的倍數(shù),因此,需要加上=把Base64字符串的長度變?yōu)?的倍數(shù),就可以正常解碼了。

請寫一個能處理去掉=的base64解碼函數(shù):

>>> base64.b64decode('YWJjZA==')
'abcd'
>>> base64.b64decode('YWJjZA')
Traceback (most recent call last):
 ...
TypeError: Incorrect padding
>>> safe_b64decode('YWJjZA')
'abcd'

小結

Base64是一種任意二進制到文本字符串的編碼方法,常用于在URL、Cookie、網頁中傳輸少量二進制數(shù)據(jù)。

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注創(chuàng)新互聯(lián)-成都網站建設公司行業(yè)資訊頻道,感謝您對創(chuàng)新互聯(lián)的支持。


本文名稱:怎么處理Python中字符編碼問題-創(chuàng)新互聯(lián)
網頁地址:http://www.xueling.net.cn/article/dpepog.html

其他資訊

在線咨詢
服務熱線
服務熱線:028-86922220
TOP
主站蜘蛛池模板: 日韩欧无码一区二区三区免费不卡 | 日韩精品视频在线一区二区三区 | 欧美日韩高清丝袜 | 成人AAA片一区国产精品 | 不卡在线观看亚洲视频 | 国产精品丝袜久久久久久消防器材 | 韩国av在线 | 国产乱来视频 | 97久久人人爽人人爽人人片 | 99久久久久国产精品免费 | 国产激情在线 | 亚洲AV无码欧洲AV无码网站 | 精品在线第一页 | 久久91亚洲精品中文字幕奶水 | 亚洲精品午夜一区人人爽 | 亚洲AV永久中文无码精品 | 爱爱视频一区 | 在线看免费无码AV天堂 | 在线免费观看国产 | 国产裸拍裸体视频在线观看 | porny丨精品自拍视频 | 国产精品久久久久一区二区国产 | 女人与禽姓交视免费看 | 国产精品一区二区av片 | 欧美丰满熟妇xxxx性ppx人 | 亚洲熟妇AV一区二区三区宅男 | 在线天堂一区 | 精品久久综合1区2区3区激情 | 日本高清一级 | 国产在线视频欧美一区二区三区 | www.91麻豆 | 西出玉门40集全免费播放 | 国产伦精品一区二区三区免费 | 日韩69| 日本丰满少妇高潮呻吟 | 四虎国产精品成人免费久久 | 国产第一页第二页 | 夜夜调教禁脔欢爱h | 少妇无码AV无码一区 | 黄色影院国产 | 免费乱人伦|