ELI5:导数,偏导数

导数 导数就是描述某个事物的变化速率。 举个最常见的例子,当人从某地移动到另一地点的时候,速度就是这个移动的导数,因为它描述了移动的变化速率;再继续看,加速度就是速度的导数,因为加速度描述了速度的变化速率。当加速度恒定的时候,我们可以想到,速度就是一条斜线,再进一步就能想到移动的距离是一个抛物线。 阅读更多…

写高性能的Pandas代码

写高性能的Pandas代码 我觉得吧,python作为科学计算的最常使用语言之一,应对大量的数据计算,如果太慢了,会让需要不断试错的科学计算方法消耗过多的时间。所以我常常在思考,python到底有多慢,让大家一开始用就觉得它慢?又有多快,让大家都用它来进行上GB数据的计算? pandas是用来处理科 阅读更多…

从泰坦尼克项目中,学习数据处理

前言 学习机器学习也有一段时间了,在这段时间内,有很多感想,其中之一就是数据处理的重要。在机器学习中,一般使用pandas进行数据的处理,使用matplotlib或者seaborn进行图形化数据,两者结合起来处理和分析数据,能让之后的步骤事半功倍。用来学习的项目是kaggle上的项目,有很多人分享了 阅读更多…

Cost Function

代价函数,通常用来判断模型的拟合程度。 其中有一个方差公式,应该都能看出来,通过方差来进行拟合的衡量。但是让人疑惑的就是为什么是方差的 呢,其实这个 完全是为了之后计算方便而设置的,因为之后求导,能够把这个 抵消,方便之后更好的进行计算。

LeetCode 72. Edit Distance

LeetCode 72. Edit Distance 题目:给定两个单词,将第一个单词转换成第二个单词,需要的最少的步数。其中:替换,删除,增加都算是一个步数。 思路:不知道为啥这题标为难,其实也是超级简单的题目,唯一需要动一点脑子的,就是删除的那个操作,第二个单词的下标是不需要往前移的。比较值得注 阅读更多…

python中的defaultdict

在一个需求中意外的发现了defaultdict这个东西,python中的dict很好理解,可是有一个使用起来不方便的地方在于,需要进行初始值是否初始化的判断: list = [“aaa”, “bbb”, “ccc”, “aaa”] kv = {} for d in list: if d in kv: 阅读更多…