您可能会认为我们需要了解多少数学才能开始数据科学?没有具体的答案,但我有办法让您开始。
为什么?
与软件工程数据科学不同,不是主要关于编程,而是关于数据和了解数据点之间的关系。为了做到这一点,我们需要注意,我们大多数人都没有,因此我们需要 Math 才能理解数据。您将数据科学技能转化为现实世界的大部分能力取决于您对数学的成功和理解。数学知识对于数据科学职业是必需的,因为机器学习算法,数据分析和洞察发现都取决于它。尽管您的学位和数据科学方面还有其他要求,但数学通常是最关键的。
。数据科学ð数学
让我们谈谈您在数据科学生涯中将使用的最常见数学类型。
线性代数
线性代数是涉及向量空间的数学分支。它包含矢量,矩阵等的概念。线性代数被数据科学家广泛使用(通常是隐式,而不是不理解它的人)。阅读教科书不是一个坏主意。
资源
- https://www.khanacademy.org/math/linear-algebra
- https://www.youtube.com/playlist?list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab
- https://web.stanford.edu/~boyd/vmls/
- http://mitran-lab.amath.unc.edu/courses/MATH347DS/textbook.pdf
- https://fong.cs.wmich.edu/modules/LinearAlgebraPrimerConcepts.pdf
统计和概率
统计信息是指我们了解数据的数学和技术。当使用逻辑回归,歧视分析和假设检验和分布等分类时,这对于机器学习至关重要。
资源
- https://www.khanacademy.org/math/statistics-probability
- https://seeing-theory.brown.edu/#secondPage
- https://www.youtube.com/watch?v=XcLO4f1i4Yo
- https://www.udacity.com/course/intro-to-descriptive-statistics--ud827
结石
微积分用于机器学习来创建损失/成本/目标功能,这些功能用于训练算法以实现其目标。它包含衍生物,曲率,差异和二次逼近的研究。
资源
- https://www.khanacademy.org/math/multivariable-calculus
- https://www.youtube.com/playlist?list=PLZHQObOWTQDMsr9K-rj53DwVRMYO3t5Yr
- https://ocw.mit.edu/courses/18-01sc-single-variable-calculus-fall-2010/
- https://ocw.mit.edu/courses/18-02sc-multivariable-calculus-fall-2010/
在将来的文章中,我们将详细讨论每个主题,以及如何使用它们以及何时使用它们,以便敬请期待并保存系列。如果您有什么要说的评论,我是新手博客写作的新手,所以感谢任何类型的反馈。
。