首页 技术 正文
技术 2022年11月11日
0 收藏 924 点赞 3,224 浏览 1980 个字

字符编码的发展:

ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号。

为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5。

GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7,低字节从A1-FE,占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。

GB2312 支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的 GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030,对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。

从ASCII、GB2312、GBK 到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

有的中文Windows的缺省内码还是GBK,可以通过GB18030升级包升级到GB18030。不过GB18030相对GBK增加的字符,普通人是很难用到的,通常我们还是用GBK指代中文Windows内码。

显然ASCII码无法将世界上的各种文字和符号全部表示,所以,就需要新出一种可以代表所有字符和符号的编码,即:Unicode

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,
注:此处说的的是最少2个字节,可能更多

UTF-8,是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存…

小知识点:

字符编码声明:# -*- coding:utf-8 -*-

变量:
变量只能是 字母,数字或下划线的任意组合,但首个字符不能为数字,且不能有空格
以下关键字不能声明为变量:
and ,as,   assert, break ,class ,continue ,def ,del ,elif ,else ,except
exec ,finally ,for,  from ,golbal,  if ,import ,in ,is ,lamda ,not ,or, pass,  print ,raise
return,  try ,while ,with ,yield

 第一个python程序

  print(“hello world!”) 

if-else结构及while循环之猜数字

 import random
age_of_gkx = random.randint(1,100)
count = 0
while count < 3:
age_num = int(input('guess number: '))
if age_num == age_of_gkx:
print('you got it.')
break
elif age_num > age_of_gkx:
print('think smaller')
else:
print('think bigger')
count +=1
if count ==3:
choice_num = input('continue Y or N ?')
if choice_num != 'n':
count = 0
else:
print('you have no chance')
break

小知识点占位符:  %s(字符串) %d(数字) %f input 输入的默认都是 string,如果想变为数字,要用强制转换 a = int(str)

for循环之打印10以内奇数:

 for i in range(2,11,2):
print(i)

用cmd寻找路径
exit() 退出当前环境,进入cmd命令。
1、 进入 所在盘符 【e:】
2、显示所在盘目录 dir
3、进入dir所示目录的某个文件夹X, 【cd X】
4、循环3 直到进入到想要的路径
5、运行python文件DD.py 【python DD.py】

6、可以直接在文件夹地址栏全选直接打【cmd】然后回车,会自动跳出cmd控制台并cd到当前路径

下一篇: day19_python_1124
相关推荐
python开发_常用的python模块及安装方法
adodb:我们领导推荐的数据库连接组件bsddb3:BerkeleyDB的连接组件Cheetah-1.0:我比较喜欢这个版本的cheeta…
日期:2022-11-24 点赞:878 阅读:9,490
Educational Codeforces Round 11 C. Hard Process 二分
C. Hard Process题目连接:http://www.codeforces.com/contest/660/problem/CDes…
日期:2022-11-24 点赞:807 阅读:5,905
下载Ubuntn 17.04 内核源代码
zengkefu@server1:/usr/src$ uname -aLinux server1 4.10.0-19-generic #21…
日期:2022-11-24 点赞:569 阅读:6,738
可用Active Desktop Calendar V7.86 注册码序列号
可用Active Desktop Calendar V7.86 注册码序列号Name: www.greendown.cn Code: &nb…
日期:2022-11-24 点赞:733 阅读:6,491
Android调用系统相机、自定义相机、处理大图片
Android调用系统相机和自定义相机实例本博文主要是介绍了android上使用相机进行拍照并显示的两种方式,并且由于涉及到要把拍到的照片显…
日期:2022-11-24 点赞:512 阅读:8,129
Struts的使用
一、Struts2的获取  Struts的官方网站为:http://struts.apache.org/  下载完Struts2的jar包,…
日期:2022-11-24 点赞:671 阅读:5,292