栏目分类:
子分类:
返回
文库吧用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
文库吧 > IT > 软件开发 > 后端开发 > Python

Python学习杂谈

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python学习杂谈

1.Python软件类型

       Python软件和Pycharm软件,最大的区别就是Python是一条一条的执行,Pycharm软件是写完后一起执行。简单的说,pycharm是一种专为 Python编程语言设计的 IDE (集成开发环境)。使用 pycharm编写 Python程序,并最终得到 Python解释器的支持,这两种方法都可以使用。

2.Python安装和Pycharm安装前面文章已经介绍https://mp.csdn.net/mp_blog/creation/editor/121645282https://mp.csdn.net/mp_blog/creation/editor/1216452823.Python函数

        Python函数是指组织好的、可重复使用的、用来实现单一或相关联功能的代码段。Python函数包含系统中自带的一些函数、第三方函数、以及用户自定义的函数。我们这里说的函数指的是第三方函数,比如我们自动化办公常用的pandas、xlwings、win32com等。简单来说,函数就是多个功能的集合,方便你更高效率编程。

4.函数如何安装

Anaconda安装库函数见Anaconda安装遗传和进化算法库函数安装——geatpyhttps://mp.csdn.net/mp_blog/creation/editor/1223336055.函数如何使用?

         在最开始的时候对第三方库进行引入,如“import pandas as pd”

6.变量、字符串等

        变量就是一个容器,用来存储你想存的东西,赋值就是把你想存的东西放进这个容器里面。变量命名不能使用Python内置的函数,如print。

        Python里面有很多内置函数,如print(),比如你可以用:

print('hello world!')

 7.Pycharm的自带提示

         Pycharm有很多友好的提示:如红色波浪线~代表代码有误;白色的波浪线代表编写代码格式不规范,可以Ctrl+A全选,然后按Ctrl+Alt+L自动整理;代码中不能出现中文符号,否则程序就会报错,无法运行。

8.Python的4种数据结构

        Python中有4种数据结构,以特定的形式存储数据:

        列表[数据1,数据2,数据3,数据4]

        字典{'数据1':数据1的值,'数据2':数据2的值}

        元组(数据1,数据2,数据3,数据4)

        集合{数据1,数据2,数据3,数据4}

        各种数据之间是可以相互嵌套的,比如列表中还有列表:

        a=[1,2,3,[4,5]]

9.if语句和for循环

        if语句用于判断,条件若成立,执行if下语句,条件不成立,执行else下语句,比如:

a=1
if a==1:
    print('a等于1')
else:
    print('a不等同于1')

 for语句是多次执行,指导循环结束,并执行每一次for循环里面的代码,比如执行列表里面的:

a=[1,2,3,4]
for i in a:
    print(i)

 10.自定义函数

           Python本身自带很多函数,函数是可以嵌套的,type()确定类型函数;int()转换成整数型;str()转化成字符串行;len()计算长度;round()保留几位小数点;input()用户输入数据等等。

        用户也可以自己创建自己的函数,用def 函数名(参数):函数内容。调用函数就是:函数名()。值得注意的是,函数内部使用的变量,不能在外面使用。

 参数的传递有3种:

        函数(传入1,传入2,传入3);

        函数(参数1=传入1,参数2=传入2,参数3=传入3),这种情况是不需要按顺序排列的;

        函数(传入1,传入2,参数3=传入3),前2种的混合型。

11.了解第三方库

        当你要用一个第三方库,首先你要去百度搜一下它的中文教程,比如我们下面要讲的pandas,然后你就可以进到官网去查看。

        然后你就看到它的简介,Pandas是什么?以及他的优势等等。这里简单说一下,它就是一个矩形数据结构,即有行索引也有列索引。跟我们常用的EXCEL很像。如下图:

 12.使用pandas进行Excel删除重复数据

12.1 首先引入函数,as是简称的意思,这样后续代码可以简洁一些。

import pandas as pd

12.2 读取Students_Duplicates.xlsx并赋值给students,这里注意是没有路径的,所以文件与编程所保存的路径一致,可以根据你实际的文件设置。

students = pd.read_excel('Students_Duplicates.xlsx')

12.3 duplicated是pandas里面的一个函数,用于判断重复记录(行)

dupe = students.duplicated(subset=['Name','Test_1','Test_2','Test_3'])

12.4 dupe返回的是布尔值,即True和False。重复就是True,用iloc函数可以将重复数据进行确认,然后再用print打印出来。

dupe = dupe[dupe == True]
print(students.iloc[dupe.index])#定位重复数据

12.5 用drop_duplicates可以将重复数据删除,subset设置几个参数就对比几列,如你想对比'Name','Test_1','Test_2',那就只填这3个,在EXCEL中有1个重复的可以选择一列删除重复,如果多列删除就比较麻烦。使用Python可以很方便解决这个问题。

students1=students.drop_duplicates(subset=['Name','Test_1','Test_2','Test_3'],inplace=False, keep='last')#基于哪一列删除 keep='last'保留最后一个
print(students)
print(students1)

 文章主要参考:三生陪你学Python

转载请注明:文章转载自 www.wk8.com.cn
本文地址:https://www.wk8.com.cn/it/1037283.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 wk8.com.cn

ICP备案号:晋ICP备2021003244-6号