经验分享:0基础如何学Python、爬虫

2023-01-31 00:01:15 经验 爬虫 基础

主要讲述转型的三个方面:web开发爬虫数据分析人工智能

python的发展主要有几个方向:

网络,爬虫,数据分析,测试运维,人工智能等,要属当下最火的还是人工智能,好多人冲着人工智能的方向学Python,其实人工智能听起来确实很高大上,都想往这方面涌入,但是作为过来人,如果单纯从编程0基础想转行人工智能还是难度相当大的(大神除外),因为好多搞人工智能的公司会相对比较大,现在企业又不愿意去培养人,所以招聘时候学历,专业,项目经验,工作年限都相对还是比较硬性的。

虽然门槛比较高,但是想转行python进而转型数据分析和人工智能也是有很大机会的,毕竟python在国内火起来也没多长时间,只要按照科学有效的方法学习提升,也是可以很快转型的,由于对运维和测试不是特别了解,这里不在说这方面的转型路线,先讲WEB后端开发、爬虫开发、数据分析与人工智能路线。

 

学习python过程中有不懂的可以加入我的python零基础系统学习交流秋秋qun:前面是934,中间109,后面是170,与你分享Python企业当下人才需求及怎么从零基础学习Python,和学习什么内容。相关学习视频资料、开发工具都有分享

1,首先是转行python学习路线:

通用必备基础知识 :(这些知识不管是做python哪方面,都是基础知识,必须会)

第一阶段:Python入门框架再怎么变,基本语法不会变,基础中的基础)

数据类型

循环判断

常用模块

函数,迭代器,装饰器

递归,迭代,反射

面向对象编程

第二阶段:网络编程(最好能完全搞透彻)

Socket c / s编程,Twisted异步网络框架

多线程,多进程,携程gevent,选择\ poll \ epoll

FTP服务器开发

批量命令,文件分布工具

RabbitMQ消息队列sqlAlchemy ORM

Reids \ MemCache \ mongoDB缓存数据库

第三阶段:正则表达式数据库

学习字符串匹配的正则表达式重模块

学习的Mysql的数据库(80%以上的公司都在用)

学习的Redis的数据库(做网站和爬虫都很重要)

学习的MonGoDB的数据库

第四阶段:web前端基础(坑比较多,多敲)

做WEB当然要懂点基本的前端知识。

html / CSS基础

 原生js 

Jquery的的(JS库)

ajax的异步加载

 绘图库

引导(了解,最好能掌握一种布局框架)

好了,以上就是不管你后面发展那些方面,这些都是基础中的基础,必须要学

2,转型python的网站后端开发学习的知识:

Django的(应用广泛的后端框架)

tornado

flask(后起之秀的框架)

session/中间件/ ORM / CSRF / FORM(一些网络基本的技术知识)

Django,flask,tornado,三个框架各有优劣,网页框架我用的Django和flask居多,Django的会觉得很多东西都已经封装好了,可以直接用,不用自己手动构造,比如Django的的管理的后台和xadmin后台,flask就相对灵活多变,至少掌握两个框架,多多益善(我在培训班1个半月,学的django和flask2个框架)

3,转型爬虫学习的知识:

requests:发送网页请求,返回数据

xpath:用于网页元素的提取(当然还有BS4,pyquery等,选择顺手的)

selenium:用于真实浏览器访问网页,根据具体情况使用

scrapy:用于大规模快速网页数据爬取

验证码破解:验证码破解建议大家可以多搞点难破解的,比如滑块验证码,淘宝验证码,12306验证码等等,面试经常问到哦

4,转行数据分析(机器学习,人工智能)学习路线:

(以下几个模块是数据分析最常用的库,一定要学好)

1,学习科学计算和分析包,numpy的和pandas

2,学习可视化,分析结果可视化的包matplotlib,实现数据绘图展示

3,学习数据挖掘模型,这个包主要是sklearn,里面的算法基本都有对应的包,但希望大家能对高等数学,概率论,线性代数,信息论的基础理论进行学习,这些算法都是基于数学基础,如果数学理解不透,也只能当一个调包侠

4,神经网络的框架,推荐学习Tensorflow或者keras,Karas的是把TensorFlow封装起来的高级包,学习难度比较低。还有一个更加高级的框架CAFFE,据说很厉害。

5,常见神经网络:回归网络,分类网络,卷积神经网络(CNN)在图像语言等领域处理方面优秀,循环神经网络(RNN)利用时间序列分析(RNN LSTM),避免过度拟合。自编码网络,这个我不了解,也不感兴趣。神经网络还很多,技术前沿的东西还不知道。

好了,说到这里,基本学习路线就讲完了,下面就是最基本的学习路线总结

转型web:通用必备知识+2个网页框架

转型爬虫:通用必备知识+爬虫框架

转型数据分析:通用必备知识+数据分析库(pandas,numpy的的,matplotlib,sklearn),甚至这些还远远不够用

转型人工智能:通用必备知识+数据分析库+高等数学+线性代数+概率论+ tensorflow框架

相关文章