城市直播房产教育博客汽车
汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

第31讲字符串编码转换(和猫妹学Python)

11月7日 碧落盟投稿
  小朋友们好,大朋友们好!
  我们今天继续学习字符串,内容如下:
  位、字节、字长
  编码格式
  str和bytes
  encode()方法
  decode()方法
  位、字节、字长
  先学习计算机中常用的几个概念,位、字节、字长。
  位(bit,缩写为b):代表一个0或1(即二进制)。
  字节(Byte,缩写B):每8个位组成一个字节,取值范围0000000011111111,表示范围0255。
  左侧为高位,右侧为低位。
  比如下图表示01000001:
  不同数量级的换算:
  1字节(Byte)8位(bit)
  1KB(Kilobyte,千字节)1024B
  1MB(Megabyte,兆字节)1024KB
  1GB(Gigabyte,吉字节,千兆)1024MB
  1TB(Trillionbyte,万亿字节,太字节)1024GB
  1PB(Petabyte,千万亿字节,拍字节)1024TB
  1EB(Exabyte,百亿亿字节,艾字节)1024PB
  1ZB(Zettabyte,十万亿亿字节,泽字节)1024EB
  1YB(Yottabyte,一亿亿亿字节,尧字节)1024ZB
  1BB(Brontobyte,千亿亿亿字节)1024YB
  字长:CPU一次并行处理的位数称为字长。
  手机:32位、64位
  计算器:16位、32位、64位
  单片机:8位、16位、32位、64位
  猫妹的计算机配置,内存16GB,64位操作系统。
  编码格式
  世界上第一台通用计算机:
  时间:1946年2月14日
  名字:ENIAC
  诞生地:美国宾夕法尼亚大学诞生。
  发明人:是美国人莫克利(JohnW。Mauchly)和艾克特(J。PresperEckert)。
  描述:由18000多个电子管组成,体重达30多吨,占地有两三间教室那么大,是一台又大又笨重的机器。
  它的诞生具有划时代的意义,对人类历史的发展产生了极其深远的影响。
  可见计算机最早出现在美国。
  美国使用英语,英语26个字符,加上大小写,也不是太多,1个字节(B)可表示256个符号,所以1个字节(B)够使用了,这种编码格式就是ASCII。
  ASCII分为标准ASCII码(基础ASCII码)和扩展ASCII码。标准ASCII码:使用前7位表示128个字符。可表示所有的大写和小写字母,数字0到9、标点符号,以及在美式英语中使用的特殊控制字符。扩展ASCII码:后128个称为扩展ASCII码。许多基于x86的系统都支持使用扩展(或高)ASCII。扩展ASCII码允许将每个字符的第8位用于确定附加的128个特殊符号字符、外来语字母和图形符号。
  标准ASCII,031及127(共33个)是控制字符或通信专用字符(其余为可显示字符)。
  如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;
  通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;
  ASCII值为8、9、10和13分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
  32126(共95个)是字符(32是空格),其中4857为0到9十个阿拉伯数字。
  6590为26个大写英文字母,97122号为26个小写英文字母,其余为一些标点符号、运算符号等。
  同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。
  猫妹的测试代码31。1。1。pycoding:UTF8deftestAscii():print(uAscii字符测试)foriinrange(0,256):foriinrange(0,256):chr()返回值是当前整数对应的ASCII字符print(〔,i,〕,chr(i),end)print(〔,i,〕,chr(i))defmain():testAscii()ifnamemain:main()
  中文汉字几千个?
  该如何存储呢?
  GBK和GB2312是我们指定的中文编码格式标准,使用2个字节表示中文字符。
  GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB2312。基本集共收入汉字6763个和非汉字图形字符682个。
  GB2312中对所收汉字进行了分区处理,每区含有94个汉字符号。这种表示方式也称为区位码。
  0109区为特殊符号。
  1655区为一级汉字,按拼音排序。
  5687区为二级汉字,按部首笔画排序。
  1015区及8894区则未有编码。
  举例来说,啊字是GB2312之中的第一个汉字,它的区位码就是1601,它的GB2312为(0xA00x10,0xA00x010xB0A1)。区位码区字节位字节(与区位码对比:0xB00xA016,0xA10xA01)。
  GBK向下与GB2312编码兼容,向上支持ISO10646。1国际标准,是前者向后者过渡过程中的一个承上启下的产物。
  ASICII、GB2312、GBK、GB18030之间的关系可以用下图表示
  随着计算机的发展,各个国家联系越来越多,中国有GBK编码,别的国家有其自身的编码(比如巴基斯坦码、土库曼斯坦码、吉尔吉斯斯坦码、哈萨克斯坦码、乌斯别克斯坦码等),
  如果冲突了怎么办?
  会产生乱码,比如:
  要怎么解决各个国家不同编码问题呢?
  制订一套统一的标准不就可以了。
  Unicode标准的出现就是为了解决各国字符标准不统一的问题,把世界上所有的字符都放在一起,并给它们统一编码。
  它的具体实现有UCS2、UCS4、UTF8等。
  UCS2编码,2个字节,可表示65536个字符,后来发现65536太少了。
  UCS4编码,4个字节,可表示2的32次方个字符,将近43亿个字符。并未流行,因为需要存储空间较大。
  UTF8编码,每次传输8位数据,是一种可变长的编码格式。UTF8编码将UCS4编码分为4个区间:
  比如王字,UCS4字符集里面码为:0000738B,在上述第三区间
  王字UCS4位码:1110011100010110111001110001011
  UTF8第三区间:11101010
  从后向前插入得到:1110011110001110100010110xE78E8B
  在Python3。x中,默认使用编码格式为UTF8,这种编码有效格式有效地解决了中文乱码问题。
  str和bytes
  在Python中,有两种常用的字符串类型,分别是str和bytes。
  其中str表示Unicode字符(ASCII或其他),bytes表示二进制数据(包括编码的文本)。
  这两种类型的字符串不能拼接在一起。
  通常,str在内存以Unicode表示,一个字符对应若干个字节。
  在网络上传输或保存磁盘,需要把str转换为字节类型,即bytes类型。
  bytes类型的数据是带有b前缀的字符串(单引号或双引号),比如b’’和b’mr’都是bytes类型的数据。
  str类型和bytes类型之间可以通过encode()和decode()方法进行转换,这两个方法是互逆过程。
  比如:
  str类型的王,对应bytes类型的0xE78E8B。
  encode()方法
  encode()方法为str对象的方法,可以将字符串转换为二进制(即bytes),也称为编码,格式如下:
  strname。encode(〔encodingutf8〕〔,errorsstrict〕)strname:要进行转换的字符串encoding:可选参数,用于指定进行编码时采用的字符编码,默认为utf8,如果使用简体中文,可设置为gb2312。当只有这一个参数时,也可以省略前面的encoding,直接写编码。errorsstrict:可选参数,用于指定错误处理方式,strict指遇到非法字符就抛出异常,ignore指忽略非法字符,replace指用?替换非法字符,xmlcharrefreplace指使用XML的字符引用,默认为strict。
  在使用encode()方法时,不会修改原字符串。
  猫妹的测试代码31。4。py:print(1)str1AstrNew1str1。encode()print(strNew1)print(2)str2王strNew2str2。encode()print(strNew2)strNew2str2。encode(encodinggb2312)print(strNew2)strNew2str2。encode(GBK)print(strNew2)print(3)str3啊strNew3str3。encode(encodinggb2312)print(strNew3)
  decode()方法
  decode()方法为bytes对象的方法,用于将二进制数据转换为字符串,也称为解码,格式如下:
  bytesname。decode(〔encodingutf8〕〔,errorsstrict〕)bytesname:要进行转换的二进制数据,通常是encode()方法转换的结果encoding:可选参数,用于指定解码时采用的字符编码,默认为utf8,如果使用简体中文,可设置为gb2312。当只有这一个参数时,也可以省略前面的encoding,直接写编码。在设置解码采用的字符编码时,需要与编码时采用一致。errorsstrict:可选参数,用于指定错误处理方式,strict指遇到非法字符就抛出异常,ignore指忽略非法字符,replace指用?替换非法字符,xmlcharrefreplace指使用XML的字符引用,默认为strict。
  在使用decode()方法时,不会修改原字符串。
  猫妹的测试代码31。5。pyprint(1)str3好好学习天天向上strNew3str3。encode(encodinggb2312)print(strNew3)byte1bstrNew1byte1。decode(encodinggb2312)print(strNew1)
  好了,今天的学习就到这里!
  我们下次见!
搜索 投诉 评论 转载

世界杯中的奇装异服,球迷们因比赛而疯狂,你最喜欢哪一款?2022年世界杯在卡塔尔盛大开幕,球迷们在赛场上以一些古怪的装扮融入赛事,为世界杯带来别样的风采。历届世界杯以来,来自全球各地的球迷在赛场外带来的娱乐效果,与球场上的球员几乎一……花有重开日警无再少年三司时三级警司,警衔一杠一星,缀钉一道银色横杠,加一颗四角星花我们轻视一切浑身上下都冒着热血与激情那时的我们,轻视沉稳那时的我们,涉世较浅看……天生富贵相的10位女明星,个个一脸福气,个个都好命,真玄学娱乐圈有一种女明星,似乎自带锦鲤体质,毫不费力,就能迎来幸福的人生。她们要么出生在殷实的家庭,要么事业运很好,要么婚姻圆满。都说相由心生,究竟是内心世界和成长环境决……国产版本田e?江南新款代步小车曝光,外观复古,动力也挺足还记得去年本田在海外发布的Hondae吗?虽然这台车没能进入国内,但是其凭借着复古的外观,给我们留下了深刻的印象。随着国内新能源市场的不断升温,大批国内车企准备在新能源领域持续……5G时代,虚拟运营商企业拿什么和三大运营商PK?5G进程的加速,作为一场端到端的跨行业革命,5G将深层渗透至各个行业,为产业赋能,为新时代开创全新机遇。5G时代,我国移动转售产业整体也迎来巨大机遇。三大运营商对民营企业……突然成版本节奏发动机,回血超蔡姬开团能力强,玩的人却不多哈喽,大家好!我是老张。在王者荣耀当中,辅助分为两种,一种是软辅,凭借着自身超强的控制能力和功能性,让很多妹子玩家十分喜爱。另一种则是硬辅,凭借着自身巨高的坦度和不俗的控制,让……第31讲字符串编码转换(和猫妹学Python)小朋友们好,大朋友们好!我们今天继续学习字符串,内容如下:位、字节、字长编码格式str和bytesencode()方法decode()方法……被困住的蓝月亮来源伯虎财经(bohuFN)作者梦得说起蓝月亮,你的第一反应是:洗衣液?洗手液?谁能想到,曾靠两液暴富创造神话的蓝月亮,在十几年后,却被困在了这两液里。……手机里值得下载的优秀APP一:无损修复老照片(安卓)这是一款在线只能修复,立等可取的app,在线修复老照片,使用AI人工智能技术,可以将模糊照片、像素不高的照片,噪点痕迹修复,针对面部进行高清还原……氢能产业驶入快车道,氢能燃料电池能否颠覆新能源市场?双碳目标推动下,中国能源技术结构转变加速,探索新型高效清洁的能源成为全行业的大趋势。氢,频频被看好,有望成为下一代能源结构的核心动力。氢燃料电池则被认为是未来清洁环……离谱!皮蓬48岁美颜前妻有新欢,竟是乔丹二儿子,直接坐腿上亲北京时间9月25日,自从退役之后,皮蓬专门出了本书,而且屡屡在采访的时候抨击乔丹狂吹詹姆斯,现在看起来原因可能找到了。近日权威的美国花边媒体曝光了一个重磅消息,乔丹的二儿……为什么删了喜欢很久的人为什么删了喜欢很久的人都说感情里最可怕的不是失去,而是后悔。人在恋爱里,总是会有一些说不出口的遗憾,而这些遗憾,也往往被对方当做是成长和进步的标志。可是有些人,偏偏不懂得……
5种催老剂藏在食物里,营养专家划出禁食清单,尽量少吃鱼跃医疗被指发国难财的背后,是尴尬的盈利窘境2023年换机优先考虑大内存!这4款良心机型流畅用五年没问题内维尔战塞内加尔拉什福德凯恩斯特林应首发,萨卡替补羽绒服搭配这5条裤子显瘦又好看,简约日常还有高级感山东潍坊推动制造业转型升级崛起千亿元级动力装备产业中国举重队,奥运冠军被抓作假?我想,我已经非常幸福了两大借贷巨头已倒下,NEXO会是下一个吗?独你走入我心龙口市2022年度专利质押融资工作取得丰硕成果当非遗遇见云南(德宏)(2)最灿烂,傣族的那抹织锦
1年收入12万,如何翻倍300万?你知道吗假如我是一只狮子心怀感恩之心的初中作文打字慢的伤痛房企生火取暖多元化经营谋求第二曲线世界上最应该漂亮的女人电脑密码忘记了怎么办才好不爱爱茅台天猫爆发茅台女子力后消费者占据半壁江山盘点产后保健的个误区侃侃而谈的典故东莞骨折工伤等级评估可以去哪里申请杨澜带着富豪丈夫现身,头发花白很显老

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找江西南阳嘉兴昆明铜陵滨州广东西昌常德梅州兰州阳江运城金华广西萍乡大理重庆诸暨泉州安庆南充武汉辽宁