Python程序设计语言基础06（完）：组合数据类型

阅读量：266 次

发布时间：2019-03-01

本文共 1442 字，大约阅读时间需要 4 分钟。

组合数据类型概述

组合数据类型能够将多个同类型或不同类型的数据组织起来，通过单一的表示使数据操作更有序、更容易。根据数据之间的关系，组合数据类型可以分为三类：序列类型、集合类型和映射类型。

序列类型

序列类型是一个元素向量，元素之间存在先后关系，通过序号访问，元素之间不排他。序列类型可以派生出多种具体类型，如字符串、元组、列表等。这些派生类型在基类操作上与序列类型兼容，但各自具有特定的性质。

集合类型

集合类型是一个元素集合，元素之间无序且唯一。集合类型的元素必须是不可变数据类型，例如整数、浮点数、字符串、元组等。集合类型本身是可变数据类型，因为可以向集合中添加或删除元素。

映射类型

映射类型是"键-值"数据项的组合，每个元素是一个键值对。Python中通过字典实现映射，字典是包含0个或多个键值对的集合，没有长度限制，可以根据键索引值的内容。

集合类型及操作

集合类型定义

集合类型与数学中的集合概念一致，即包括0个或多个数据项的无序组合。集合元素之间无序且唯一，不能分片，且元素类型只能是固定数据类型。

集合操作符

集合类型支持以下操作：

S ∩ T：相对补集

S ∪ T：并集

S - T：相对补集

S ^ T：对称差集

集合处理方法

集合类型支持以下方法：

pop()：随机返回集合中的一个元素，同时删除该元素。

集合类型应用场景

集合类型广泛用于对一维数据进行去重或进行数据重复处理。例如，在统计数据时，集合可以用于去除重复项。

序列类型及操作

序列类型定义

序列类型是一维元素向量，元素之间存在先后关系，通过下标可以访问序列的特定元素。序列类型是一个基类类型，在Python中派生出字符串类型、元组类型、列表类型等。

序列处理函数及方法

序列类型支持以下通用操作：

索引操作：通过索引访问特定元素。

切片操作：通过切片访问子序列。

字符串操作：字符串作为特殊的序列类型，其元素不可变。

元组类型及操作

元组类型是序列类型的一种扩展，具有以下特点：

元组创建后不能被修改。

元组可以包含可变数据类型，但整体不可变。

元组适用于固定搭配场景，如多返回值、函数参数、多变量同步赋值等。

列表类型及操作

列表类型是序列类型的一种扩展，具有以下特点：

列表创建后可以修改。

列表支持切片操作和索引操作。

列表元素类型可以不同，操作灵活。

字典类型及操作

字典类型是映射类型的具体实现，具有以下特点：

字典包含0个或多个键值对。

键可以是任意哈希类型，值可以是任意类型。

字典支持键的访问、插入和删除操作。

可变与不可变数据类型探讨

判断标准

不可变数据类型：变量值改变时，内存地址也随之改变。

可变数据类型：变量值改变时，内存地址不变。

数据类型分类

整型：不可变数据类型。

字符串：不可变数据类型。

集合：可变数据类型。

元组：不可变数据类型。

列表：可变数据类型。

字典：可变数据类型。

jieba库的使用

jieba库基本介绍

jieba库是中文分词第三方库，需要额外安装。

使用jieba库可以对中文文本进行精确分词，支持精确模式、全模式和搜索引擎模式。

jieba库使用说明

精确模式：将文本精确地切分为单词，避免冗余。

全模式：将文本中所有可能的词语扫描出来。

搜索引擎模式：在精确模式基础上，对长词再次切分。

中文词频统计实例

英文文本：默认使用空格分词。

中文文本：使用jieba库进行分词，统计词频。

通过以上内容，可以清晰地了解组合数据类型及其应用场景。

转载地址：http://nrwx.baihongyu.com/

你可能感兴趣的文章

php一句话图片运行,【后端开发】php一句话图片木马怎么解析

PHP上传文件大小限制的调整 Nginx 413 Request Entity Too Large

php中0,空,null和false的区别

查看>>

PHP中array_merge和array相加的区别分析

查看>>

PHP中Closure::bindTo的用法分析

PHP中dirname(__FILE__)的意思

查看>>

PHP中extract()函数的妙用

查看>>

PHP中fileinfo的作用以及怎么开启fileinfo

查看>>

PHP中file_get_contents如何带上cookies

查看>>

PHP中header的作用

查看>>

PHP中implode()和explode()

查看>>