重庆做网站优化推广的公司,企业网站如何进行定位,重庆建设工程安全协会网站,青岛网络公司有哪些URL编码
当 URL 路径或者查询参数中#xff0c;带有中文或者特殊字符的时候#xff0c;就需要对 URL 进行编码#xff08;采用十六进制编码格式#xff09;。URL 编码的原则是使用安全字符去表示那些不安全的字符。
安全字符#xff0c;指的是没有特殊用途或者特殊意义的…URL编码
当 URL 路径或者查询参数中带有中文或者特殊字符的时候就需要对 URL 进行编码采用十六进制编码格式。URL 编码的原则是使用安全字符去表示那些不安全的字符。
安全字符指的是没有特殊用途或者特殊意义的字符。 URL 是“统一资源定位符”Uniform Resource Locator的首字母缩写中文译为“网址”表示各种资源的互联网地址。下面就是一个典型的 URL。
组成部分协议、主机、端口、路径、查询参数、锚点等。
示例如下
http://www.ccc.net/index?param10
路径和查询字符串之间使用问号?隔开。上述示例的域名为 www.ccc.net路径为 index查询字符串为 param1。
URL 中规定了一些具有特殊意义的字符常被用来分隔两个不同的 URL 组件这些字符被称为保留字符。例如
冒号用于分隔协议和主机组件斜杠用于分隔主机和路径
?用于分隔路径和查询参数等。
用于表示查询参数中的键值对。
符号用于分隔查询多个键值对。
其余常用的保留字符有/ . … # $ ; % URL 字符转义的方法是在这些字符的十六进制 ASCII 码前面加上百分号%。下面是这18个字符及其转义形式。 !%21 #%23 $%24 %26 %27 (%28 )%29 *%2A %2B ,%2C /%2F :%3A ;%3B %3D ?%3F %40 [%5B ]%5D Unicode编码
Unicode 是容纳世界所有文字符号的国际标准编码使用四个字节为每个字符编码。
UTF 是英文 Unicode Transformation Format 的缩写意为把 Unicode 字符转换为某种格式。UTF 系列编码方案UTF-8、UTF-16、UTF-32均是由 Unicode 编码方案衍变而来以适应不同的数据存储或传递它们都可以完全表示 Unicode 标准中的所有字符。目前这些衍变方案中 UTF-8 被广泛使用而 UTF-16 和 UTF-32 则很少被使用。
UTF-8 使用一至四个字节为每个字符编码其中大部分汉字采用三个字节编码少量不常用汉字采用四个字节编码。因为 UTF-8 是可变长度的编码方式相对于 Unicode 编码可以减少存储占用的空间所以被广泛使用。
UTF-16 使用二或四个字节为每个字符编码其中大部分汉字采用两个字节编码少量不常用汉字采用四个字节编码。UTF-16 编码有大尾序和小尾序之别即 UTF-16BE 和 UTF-16LE在编码前会放置一个 UFEFF 或 UFFFEUTF-16BE 以 FEFF 代表UTF-16LE 以 FFFE 代表其中 UFEFF 字符在 Unicode 中代表的意义是 ZERO WIDTH NO-BREAK SPACE顾名思义它是个没有宽度也没有断字的空白。 ASCII码
标准ASCII 码也叫基础ASCII码使用7 位二进制数剩下的1位二进制为0来表示所有的大写和小写字母数字0 到9、标点符号以及在美式英语中使用的特殊控制字符 。
其中
031及127(共33个)是控制字符或通信专用字符其余为可显示字符如控制符LF换行、CR回车、FF换页、DEL删除、BS退格)、BEL响铃等通信专用字符SOH文头、EOT文尾、ACK确认等ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示但会依不同的应用程序而对文本显示有不同的影响 。
32126(共95个)是字符(32是空格
其中
4857为0到9十个阿拉伯数字。
6590为26个大写英文字母
97122为26个小写英文字母
其余为一些标点符号、运算符号等。 ASCII码表