置顶文章

3.7k 3 分钟

# 原则 生活态度 身体健康 身体健康乃是第一要素,所有的原则都要建立在身体健康上。 平时熬夜不得超过两点,保证睡眠充足。 早上起床工作日在 8 点左右起来,休息日要在 10 点之前起来。 平时加强锻炼,平时锻炼需要控制在 1 个小时左右,室内室外就行。 饭菜不能过于重,需要合理膳食,荤素搭配,而且每天需要补充水果。 心理健康 基于我经常内耗的情况,我需要适当性地进行心理上的培养 休息日必须要画上 2...

精选分类

心理学

Java

计算机科学

Python

计算机科学

文章列表

7.6k 7 分钟

# 数据可视化 - 2 通过前面的学习,我们已经对数据可视化工具 matplotlib 有一个初步的认知。大家可能也会发现了,matplotlib 提供的函数虽然强大,但是参数太多,要想对图表进行深度的定制就需要修改一系列的参数,这一点对新手并不友好。另一方面,使用 matplotlib 定制的统计图是静态图表,可能在某些需要交互效果的场景下并不合适。为了解决这两个问题,我们为大家介绍两个新的可视化工具,一个是 seaborn,一个是 pyecharts。 # Seaborn Seaborn 是建立在 matplotlib 之上的数据可视化工具,它相当于是对 matplotlib...
8.2k 7 分钟

# 数据可视化 - 1 在完成了对数据的透视之后,我们可以将数据透视的结果通过可视化的方式呈现出来,简单的说,就是将数据变成漂亮的统计图表,然后进一步发现和解读数据背后隐藏的商业价值。在之前的课程中,我们已经为大家展示过用使用 Series 或 DataFrame 对象的 plot 方法生成可视化图表的操作,本章我们为大家讲解 plot 方法的基石,它就是大名鼎鼎的 matplotlib 库。 # 常用的图表类型 常用的图表类型及其应用场景如下图所示。 <img...
7.7k 7 分钟

# Pandas 的应用 - 5 # DataFrame 的应用 # 窗口计算 DataFrame 对象的 rolling 方法允许我们将数据置于窗口中,然后就可以使用函数对窗口中的数据进行运算和处理。例如,我们获取了某只股票近期的数据,想制作 5 日均线和 10 日均线,那么就需要先设置窗口再进行运算。我们可以使用三方库 pandas-datareader 来获取指定的股票在某个时间段内的数据,具体的操作如下所示。 安装 pandas-datareader 三方库。 pip install pandas-datareader 通过 pandas-datareader 提供的...
7k 6 分钟

# Pandas 的应用 - 4 # DataFrame 的应用 # 数据分析 经过前面的学习,我们已经将数据准备就绪而且变成了我们想要的样子,接下来就是最为重要的数据分析阶段了。当我们拿到一大堆数据的时候,如何从数据中迅速的解读出有价值的信息,这就是数据分析要解决的问题。首先,我们可以获取数据的描述性统计信息,通过描述性统计信息,我们可以了解数据的集中趋势和离散趋势。 例如,我们有如下所示的学生成绩表。 import numpy as np import pandas as pd scores = np.random.randint(50, 101, (5, 3)) names =...
10k 9 分钟

# Pandas 的应用 - 3 # DataFrame 的应用 # 数据清洗 通常,我们从 Excel、CSV 或数据库中获取到的数据并不是非常完美的,里面可能因为系统或人为的原因混入了重复值或异常值,也可能在某些字段上存在缺失值;再者, DataFrame 中的数据也可能存在格式不统一、量纲不统一等各种问题。因此,在开始数据分析之前,对数据进行清洗就显得特别重要。 # 缺失值 可以使用 DataFrame 对象的 isnull 或 isna 方法来找出数据表中的缺失值,如下所示。 emp_df.isnull() 或者 emp_df.isna() 输出: ename job mgr...
9k 8 分钟

# Pandas 的应用 - 2 # DataFrame 的应用 # 创建 DataFrame 对象 # 通过二维数组创建 DataFrame 对象 代码: scores = np.random.randint(60, 101, (5, 3)) courses = ['语文', '数学', '英语'] ids = [1001, 1002, 1003, 1004, 1005] df1 = pd.DataFrame(data=scores, columns=courses, index=ids) df1 输出: 语文 数学 英语 1001 69...
6.1k 6 分钟

# Pandas 的应用 - 1 Pandas 是 Wes McKinney 在 2008 年开发的一个强大的分析结构化数据的工具集。Pandas 以 NumPy 为基础(数据表示和运算),提供了用于数据处理的函数和方法,对数据分析和数据挖掘提供了很好的支持;同时 Pandas 还可以跟数据可视化工具 Matplotlib 很好的整合在一起,非常轻松愉快的实现数据的可视化展示。 Pandas 核心的数据类型是 Series (数据系列)、 DataFrame (数据表 / 数据框),分别用于处理一维和二维的数据,除此之外还有一个名为 Index 的类型及其子类型,它为 Series 和...
7k 6 分钟

# NumPy 的应用 - 2 # 数组的运算 使用 NumPy 最为方便的是当需要对数组元素进行运算时,不用编写循环代码遍历每个元素,所有的运算都会自动的矢量化(使用高效的、提前编译的底层代码来对数据序列进行数学操作)。简单的说就是,NumPy 中的数学运算和数学函数会自动作用于数组中的每个成员。 # 数组跟标量的运算 代码: array35 = np.arange(1, 10) print(array35 + 10) print(array35 * 10) 输出: [11 12 13 14 15 16 17 18 19] [10 20 30 40 50 60 70 80 90] #...
9.7k 9 分钟

# NumPy 的应用 - 1 Numpy 是一个开源的 Python 科学计算库,用于快速处理任意维度的数组。Numpy 支持常见的数组和矩阵操作,对于同样的数值计算任务,使用 NumPy 不仅代码要简洁的多,而且 NumPy 的性能远远优于原生 Python,基本是一个到两个数量级的差距,而且数据量越大,NumPy 的优势就越明显。 Numpy 最为核心的数据类型是 ndarray ,使用 ndarray 可以处理一维、二维和多维数组,该对象相当于是一个快速而灵活的大数据容器。NumPy 底层代码使用 C 语言编写,解决了 GIL 的限制, ndarray...