Python是一门广泛在各个行业应用的语言,包括计算机,生物学,金融。可以说,python除了不会生孩子,其他啥都行。本文将使用python来玩转股票数据,让你见识Python的强大。
所使用的工具
python3.6Juypter notebook(交互式IDE,推荐使用)numpy,pandas用于数据分析matplotlib,seaborn用于数据可视化pandas_datareader用于获取股票数据
数据获取
我们可以从pandas_datareader获取股票数据。首先需要安装这个库
相关推荐:《python视频教程》
pip install pandaspip install pandas-datareader
然后就可以访问数据了
from pandas_datareader.data import DataReaderdatas = DataReader(name='BABA', data_source='yahoo', start='2015-01-01', end='2018-01-01')
在这里,我首先把数据存为了csv文件,让我们首先看看阿里巴巴前几年的股票数据吧。
import pandas as pd file = 'BABA.csv' #csv文件index = 'Date' #将日期作为索引列alibaba = pd.read_csv(file, index_col=index) #读取csv文件数据
然后我们简单的查看一下阿里巴巴的股票数据
alibaba.head(n = 5) #查看前5行数据
下面是股票数据的前5行,我们可以看到每天的开盘价,收盘价,最高值,最低值,成交量等。
然后再查看一下这些数据的描述,获取对数据的直观感受。
alibaba.describe()
这是对数据的统计量的一些分析,可以看到总共有789行数据,最高值和最低值相差不大。
历史趋势分析
在分析之前,我们先导入所需要的Python科学计算库。
# 数据分析import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 可视化import matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline
我们首先分析股票的闭盘价的总体趋势。
alibaba['Adj Close'].plot(legend = True)plt.title('Alibaba Adj Close')plt.ylim([50,200])plt.xlabel('Date')plt.ylabel('Price')
可以看到,虽然中间也有小小的波动,闭盘价总体趋势是上升的,这表明阿里巴巴的市值一直在上升。
然后我们了解一下每天阿里巴巴股票的日收益率,毕竟,在股市赚钱,主要靠的就是低买高卖得到的收益。
size = (10,8)alibaba['daily-return'].plot(figsize = size,linestyle = '--',marker = 'o') #折线图,原点表示最大最小点plt.title('Alibaba daily return')plt.xlabel('Date')plt.ylabel('daily return rate')
每天的收益率不是稳定的本文来源gaodai$ma#com搞$$代**码)网@,证明股市有风险,需要谨慎对待。
实用小知识:pct_change()函数将每个元素与其前一个元素进行比较,并计算变化百分比。默认情况下,pct_change()对列进行操作; 如果想应用到行上,那么可使用axis = 1参数。