Python学习杂谈

1.Python软件类型

Python软件和Pycharm软件，最大的区别就是Python是一条一条的执行，Pycharm软件是写完后一起执行。简单的说，pycharm是一种专为 Python编程语言设计的 IDE (集成开发环境)。使用 pycharm编写 Python程序，并最终得到 Python解释器的支持，这两种方法都可以使用。

2.Python安装和Pycharm安装前面文章已经介绍https://mp.csdn.net/mp_blog/creation/editor/121645282https://mp.csdn.net/mp_blog/creation/editor/1216452823.Python函数

Python函数是指组织好的、可重复使用的、用来实现单一或相关联功能的代码段。Python函数包含系统中自带的一些函数、第三方函数、以及用户自定义的函数。我们这里说的函数指的是第三方函数，比如我们自动化办公常用的pandas、xlwings、win32com等。简单来说，函数就是多个功能的集合，方便你更高效率编程。

4.函数如何安装

Anaconda安装库函数见Anaconda安装遗传和进化算法库函数安装——geatpyhttps://mp.csdn.net/mp_blog/creation/editor/1223336055.函数如何使用？

在最开始的时候对第三方库进行引入，如“import pandas as pd”

6.变量、字符串等

变量就是一个容器，用来存储你想存的东西，赋值就是把你想存的东西放进这个容器里面。变量命名不能使用Python内置的函数，如print。

Python里面有很多内置函数，如print()，比如你可以用：

print('hello world!')

7.Pycharm的自带提示

Pycharm有很多友好的提示：如红色波浪线~代表代码有误；白色的波浪线代表编写代码格式不规范，可以Ctrl+A全选，然后按Ctrl+Alt+L自动整理；代码中不能出现中文符号，否则程序就会报错，无法运行。

8.Python的4种数据结构

Python中有4种数据结构，以特定的形式存储数据：

列表[数据1，数据2，数据3，数据4]

字典{'数据1':数据1的值，'数据2':数据2的值}

元组(数据1，数据2，数据3，数据4)

集合{数据1，数据2，数据3，数据4}

各种数据之间是可以相互嵌套的，比如列表中还有列表：

a=[1,2,3,[4,5]]

9.if语句和for循环

if语句用于判断，条件若成立，执行if下语句，条件不成立，执行else下语句，比如：

a=1
if a==1:
    print('a等于1')
else:
    print('a不等同于1')

for语句是多次执行，指导循环结束，并执行每一次for循环里面的代码，比如执行列表里面的：

a=[1,2,3,4]
for i in a:
    print(i)

10.自定义函数

Python本身自带很多函数，函数是可以嵌套的，type()确定类型函数；int()转换成整数型；str()转化成字符串行；len()计算长度；round()保留几位小数点；input()用户输入数据等等。

用户也可以自己创建自己的函数，用def 函数名(参数)：函数内容。调用函数就是：函数名()。值得注意的是，函数内部使用的变量，不能在外面使用。

参数的传递有3种：

函数（传入1，传入2，传入3）；

函数（参数1=传入1，参数2=传入2，参数3=传入3），这种情况是不需要按顺序排列的；

函数（传入1，传入2，参数3=传入3），前2种的混合型。

11.了解第三方库

当你要用一个第三方库，首先你要去百度搜一下它的中文教程，比如我们下面要讲的pandas，然后你就可以进到官网去查看。

然后你就看到它的简介，Pandas是什么？以及他的优势等等。这里简单说一下，它就是一个矩形数据结构，即有行索引也有列索引。跟我们常用的EXCEL很像。如下图：

12.使用pandas进行Excel删除重复数据

12.1 首先引入函数，as是简称的意思，这样后续代码可以简洁一些。

import pandas as pd

12.2 读取Students_Duplicates.xlsx并赋值给students，这里注意是没有路径的，所以文件与编程所保存的路径一致，可以根据你实际的文件设置。

students = pd.read_excel('Students_Duplicates.xlsx')

12.3 duplicated是pandas里面的一个函数，用于判断重复记录（行）

dupe = students.duplicated(subset=['Name','Test_1','Test_2','Test_3'])

12.4 dupe返回的是布尔值，即True和False。重复就是True，用iloc函数可以将重复数据进行确认，然后再用print打印出来。

dupe = dupe[dupe == True]
print(students.iloc[dupe.index])#定位重复数据

12.5 用drop_duplicates可以将重复数据删除，subset设置几个参数就对比几列，如你想对比'Name','Test_1','Test_2'，那就只填这3个，在EXCEL中有1个重复的可以选择一列删除重复，如果多列删除就比较麻烦。使用Python可以很方便解决这个问题。

students1=students.drop_duplicates(subset=['Name','Test_1','Test_2','Test_3'],inplace=False, keep='last')#基于哪一列删除 keep='last'保留最后一个
print(students)
print(students1)

文章主要参考：三生陪你学Python

Python学习杂谈

Python相关栏目本月热门文章