Category: Python / Wxpython

Python读写csv/excel文件, Python 读取指定csv行, Python生成csv文件, Python操作csv文件, Python操作CSV和Excel

  概述 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列.   CSV操作 csv写入 1.写入列表(list)数据 使用 csv.writer 对象 delimiter 指定同一行每个字段的分隔字符。若不指定,默认以英文逗号(,)分隔,在csv文件中显示的是不同单元格,若以其他符号分隔,则显示在csv同一单元格中 import csv with open(r'e:\zarten.csv', 'w',… Read More

python 解析 pdf文件, parse PDF files and extract elements like text

pdfminer.six Pdfminer.six是原始PDFMiner的社区维护分支。它是从PDF文档中提取信息的工具。它着重于获取和分析文本数据。Pdfminer.six直接从PDF的源代码中提取页面中的文本。它也可以用来获取文本的确切位置,字体或颜色。 它以模块化方式构建,因此可以轻松替换pdfminer.six的每个组件。您可以实现自己的解释器或渲染设备,以将pdfminer.six的功能用于文本分析的其他目的。 查阅“ 阅读文档”中的完整 文档。   特征 完全用Python编写。 解析,分析和转换PDF文档。 PDF-1.7规范支持。(嗯,差不多)。 CJK语言和垂直书写脚本支持。 支持各种字体类型(Type1,TrueType,Type3和CID)。 支持提取图像(JPG,JBIG2和位图)。 支持RC4和AES加密。 目录提取。 标记内容提取。 自动布局分析。… Read More

Python 合并/追加excel, Python 合并/追加 csv, Merging Spreadsheets with Python–Append

将多个电子表格合并在一起是一项常见的任务。可以通过两种方式进行合并: 追加 -电子表格彼此并置 合并 -根据所选列的相同值水平合并电子表格列   档案 本教程将使用三个文件。您可以通过单击以下链接下载它们:MarketingAnalystNames.xlsx,SalesRepNames.xlsx,SeniorLeadershipNames.xlsx   完整代码 这是追加三个文件的完整代码 # pip install pandas # pip install… Read More

Python Selenium 选中 CheckBox 或者 Radio, Selenium 选中 单选框 或者 复选框, How to Select CheckBox and Radio Button in Selenium WebDriver

在本教程中,我们将看到如何识别以下表单元素   单选按钮 也可以使用click()方法打开单选按钮。 使用http://demo.guru99.com/test/radio.html进行练习,可以看到radio1.click()切换了“ Option1”单选按钮。radio2.click()切换“ Option2”单选按钮,而未选中“ Option1”。   复选框 也可以使用click()方法来打开/关闭复选框。 下面的代码将两次单击Facebook的“保持登录状态”复选框,然后在打开时将结果输出为TRUE,在关闭时将结果显示为FALSE。 isSelected()方法用于知道复选框是打开还是关闭。 这是另一个示例:http : //demo.guru99.com/test/radio.html   完整的代码… Read More

Selenium WebDriver中的XPath:完整教程, Xpath cheatsheet, XPath教程, XPath用法详解

  在Selenium自动化中,如果一般定位符(如id,class,name等)找不到元素,则使用XPath在网页上查找元素。 在本教程中,我们将学习xpath和不同的XPath表达式以查找复杂或动态元素,这些元素的属性在刷新或执行任何操作时会动态更改。   什么是XPath? XPath被定义为XML路径。它是使用XML路径表达式在网页上查找任何元素的语法或语言。XPath用于使用HTML DOM结构查找网页上任何元素的位置。XPath的基本格式将在下面通过屏幕截图进行说明。   XPath的语法: XPath包含位于网页上的元素的路径。创建XPath的标准语法是。 Xpath=//tagname[@attribute='value'] //:选择当前节点。 Tagname:特定节点的标记名。 @:选择属性。 Attribute:节点的属性名称。 Value:属性的值。   为了准确地在网页上找到元素,可以使用不同类型的定位器:… Read More

Python Selenium 的 XPath 定位方式详解, Selenium Webdriver中使用XPath Contains、Sibling函数定位

先介绍一下 XPath。XPath 是一门在 XML 文档中查找信息的语言。可用来在 XML 文档中对元素和属性进行遍历。 在 selenium 中定位元素,使用 XPath 能更好的抽象代码(比如讲 XPath 表达式提取成一个单独的配置)。所以我在日常使用中尽量使用 XPath。   HTML与XML html… Read More

Python操作json, Python读写json, Python 读写JSON数据, Python对json的操作及实例解析

json介绍 说明:JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于JavaScript(Standard ECMA-262 3rd Edition – December 1999)的一个子集。 JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)。这些特性使JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成。… Read More

Python 自动任务, Python 定时任务, parse-crontab, Parse and use crontab schedules in Python

  项目地址:https://github.com/josiahcarlson/parse-crontab   描述 该软件包旨在提供一种解析crontab计划条目并确定下一次应何时运行项目的方法。更具体地说,它计算从调用.next()方法到下一次应执行该项目之间的延迟(以秒为单位)。 将下面的图表与http://en.wikipedia.org/wiki/Cron#CRON_expression进行比较, 您会注意到不支持W和#符号。 Field Name 栏位名称 Mandatory 强制性的 Allowed Values 允许值 Default Value 默认值… Read More

Python: 终端交互程序,在终端中创建交互式选择列表, create curses based interactive selection list in the terminal

  pick是一个小型的python库,可帮助您在终端中创建基于curses的交互式选择列表。实际观看:   项目地址:https://github.com/wong2/pick   安装: pip install pick   如果使用了Windows,那么还要另外执行一个语句: pip install windows-curses   使用方法: pick comes… Read More

学会Python+Selenium, 搭建Web自动化框架,自动化处理浏览器任务

在日常工作当中,我们经常会和浏览器打交道,当然就可能会在浏览器上做一些重复、无脑的工作,这篇文章旨在对于这类问题出一个基于脚本的自动化解决方案。   Selenium 库 简要 一句话概括,Selenium 就是一个浏览器自动化测试框架。它支持包括 IE、Chrome、Mozilla Firefox、Mozilla Suite 在内的大多数主流浏览器。当然本文主要讲述的并不是关于它在自动化测试部分方面的运用,该部分在 Selenium 官网和网上各种 Blog 处均有很多也很详细的介绍,这里我们要说的是基于它的浏览器控制能力来演化出的另一个应用方向——自动化处理任务。   快速开始 安装… Read More

Python: SeleniumBase测试自动化, Web测试框架SeleniumBase, SeleniumBase 实例用法, SeleniumBase 模拟登录, SeleniumBase 入门

    源代码名称:SeleniumBase Github地址:https://github.com/seleniumbase/SeleniumBase SeleniumBas源代码文档 : http://www.github.com/seleniumbase/SeleniumBase/wiki SeleniumBase源代码下载 :  http://www.github.com/seleniumbase/SeleniumBase/releases   功能: 支持 python 库帮助你构建可靠的脚本。 ( python 2.7或者… Read More

python: selenium获取验证码, selenium-webdriver 登录验证码的处理, Selenium获取验证码并识别,图片验证码反爬解决思路

  获取验证码有两种思路: 1.获取页面源代码,提取验证码图片 2.利用selenium截取页面,定位验证码元素的位置,利用Image进行处理,获取其中验证码部分   下面进行解析: 1.获取页面源代码,提取验证码图片 如何获取源代码并提取验证码图片过程就不在分析了,既然看到这篇文章,相信这些工作都不在话下了。 这里只分析一下缺点:当提取验证码url后发现每次打开该验证码图片,其内容不断变化, 以搜狗验证码为例:http://weixin.sogou.com/antispider/util/seccode.php?tc=1486691901,该验证码是单独加载进页面,而非嵌入,这时候,单纯提取验证码url会发现当前验证码和提取验证码地址打开的内容不一样。这时候,我们需要一个更方便简单的方法。 2.利用selenium截取页面 selenium.webdriver 内置了截取当前页面的功能,其中: a.WebDriver.Chrome自带的方法只能对当前窗口截屏,若是需要截取的窗口超过了一屏,就只能另辟蹊径了。 b.WebDriver.PhantomJS自带的方法支持对整个网页截屏。 在这里,我们利用两种方法均可,因为验证码界面通常比较简单。 结果如图:  … Read More