diff --git a/.gitignore b/.gitignore index 0b3f323..8274510 100644 --- a/.gitignore +++ b/.gitignore @@ -4,3 +4,4 @@ _site *.gem .bundle vendor/bundle +.idea/ diff --git a/Gemfile b/Gemfile index e3e8b15..a39c244 100644 --- a/Gemfile +++ b/Gemfile @@ -1,13 +1,10 @@ source "https://rubygems.org" -ruby RUBY_VERSION - -gem "jekyll", "3.6.2" # to use GitHub Pages # gem "github-pages", group: :jekyll_plugins - # If you have any plugins, put them here! group :jekyll_plugins do + gem "jekyll", "3.6.2" gem "jekyll-feed" gem "jekyll-sitemap" gem "jekyll-redirect-from" @@ -15,4 +12,4 @@ group :jekyll_plugins do end # Windows does not include zoneinfo files, so bundle the tzinfo-data gem -gem 'tzinfo-data', platforms: [:mingw, :mswin, :x64_mingw, :jruby] +gem 'tzinfo-data', platforms: [:mingw, :mswin, :x64_mingw, :jruby] \ No newline at end of file diff --git a/Gemfile.lock b/Gemfile.lock index 4b38fc6..384a047 100644 --- a/Gemfile.lock +++ b/Gemfile.lock @@ -1,11 +1,12 @@ GEM remote: https://rubygems.org/ specs: - addressable (2.5.2) + addressable (2.6.0) public_suffix (>= 2.0.2, < 4.0) colorator (1.1.0) - ffi (1.9.25) - ffi (1.9.25-x64-mingw32) + concurrent-ruby (1.1.4) + ffi (1.10.0) + ffi (1.10.0-x64-mingw32) forwardable-extended (2.6.0) jekyll (3.6.3) addressable (~> 2.4) @@ -18,43 +19,42 @@ GEM pathutil (~> 0.9) rouge (>= 1.7, < 3) safe_yaml (~> 1.0) - jekyll-feed (0.10.0) - jekyll (~> 3.6.3) - jekyll-redirect-from (0.13.0) + jekyll-feed (0.11.0) jekyll (~> 3.3) + jekyll-redirect-from (0.15.0) + jekyll (>= 3.3, < 5.0) jekyll-sass-converter (1.5.2) sass (~> 3.4) - jekyll-seo-tag (2.5.0) + jekyll-seo-tag (2.6.0) jekyll (~> 3.3) jekyll-sitemap (1.2.0) jekyll (~> 3.3) jekyll-watch (1.5.1) listen (~> 3.0) kramdown (1.17.0) - liquid (4.0.0) + liquid (4.0.3) listen (3.1.5) rb-fsevent (~> 0.9, >= 0.9.4) rb-inotify (~> 0.9, >= 0.9.7) ruby_dep (~> 1.2) mercenary (0.3.6) - pathutil (0.16.1) + pathutil (0.16.2) forwardable-extended (~> 2.6) - public_suffix (3.0.2) + public_suffix (3.0.3) rb-fsevent (0.10.3) - rb-inotify (0.9.10) - ffi (>= 0.5.0, < 2) + rb-inotify (0.10.0) + ffi (~> 1.0) rouge (2.2.1) ruby_dep (1.5.0) - safe_yaml (1.0.4) - sass (3.5.6) + safe_yaml (1.0.5) + sass (3.7.4) sass-listen (~> 4.0.0) sass-listen (4.0.0) rb-fsevent (~> 0.9, >= 0.9.4) rb-inotify (~> 0.9, >= 0.9.7) - thread_safe (0.3.6) - tzinfo (1.2.5) - thread_safe (~> 0.1) - tzinfo-data (1.2018.5) + tzinfo (2.0.0) + concurrent-ruby (~> 1.0) + tzinfo-data (1.2018.9) tzinfo (>= 1.0.0) PLATFORMS @@ -62,15 +62,12 @@ PLATFORMS x64-mingw32 DEPENDENCIES - jekyll (= 3.6.3) + jekyll (= 3.6.2) jekyll-feed jekyll-redirect-from jekyll-seo-tag jekyll-sitemap tzinfo-data -RUBY VERSION - ruby 2.4.4p296 - BUNDLED WITH - 1.16.2 + 2.0.1 diff --git a/MLY-zh-cn.pdf b/MLY-zh-cn.pdf deleted file mode 100644 index f13de35..0000000 Binary files a/MLY-zh-cn.pdf and /dev/null differ diff --git a/README.md b/README.md index 18bfc83..55db8b0 100644 --- a/README.md +++ b/README.md @@ -1,41 +1,33 @@ -# MLY 中文版官方授权翻译仓库 +# Machine Learning Yearning 中文版 -[访问此处](https://accepteddoge.github.io/machine-learning-yearning-cn/) 开始在线阅读,希望这本书对你们有所帮助! +[访问此处](https://deeplearning-ai.github.io/machine-learning-yearning-cn/) 开始在线阅读《机器学习训练秘籍》样稿,希望这本书对你们有所帮助!当前样稿仅供内容预览,非最终版本(历史版本可以在 [release](https://github.com/deeplearning-ai/machine-learning-yearning-cn/releases) 中找到)。 -本项目一切权利归属于 deeplearning.ai ,[英文官网](https://www.deeplearning.ai/) 已经更新。 +## 合作改善翻译质量 -[PDF 版本](./MLY-zh-cn.pdf) 仅供内容预览,非最终版本(目前与英文样稿保持排版格式一致,中文字体显示不够优雅,后面可能会采用 LaTeX 排版优化显示效果),如出现内容勘误,默认每周末统一更新一次 PDF 内容,其它情况下不会对文件进行更新。 +译者水平有限,如有翻译不当之处,恳请读者帮助斧正,途径为: -译者水平有限,如有翻译不当之处,恳请读者指正,联系邮箱: [acdoge.cao@gmail.com](mailto:acdoge.cao@gmail.com) +1. 在项目的 Issues 区创建新的讨论内容;(推荐) +2. 在网页点击 “改进当前页面”,修改后发起 Pull Request; +3. [发送邮件](mailto:xiaowei@deeplearning.ai) 进行反馈,主题带有 “MLY 翻译”。 -## 目前需要解决的问题 +注:所有图片放在 `img` 路径下,本地无法预览,在文稿中的插入方式为: +``` + +``` -- [ ] 专业术语规范与检查 -- [ ] 语言流畅性优化 (亟需改善) +## 相关版权声明 -译稿路径:`_docs` 文件夹下,按照英文小节分类,可在网页文章底部点击 “改进此页面” 快速跳转。 +本项目遵循 “署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)” 协议。这是一份普通人可以理解的[许可协议](https://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.zh-Hans)概要 (但不是替代) 。 [免责声明](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#). -注:插入图片请使用如下语法(所有图片放在 `img` 路径下),本地无法预览。 - - `` - -## 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) - -这是一份普通人可以理解的[许可协议](https://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.zh-Hans)概要 (但不是替代) 。 [免责声明](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#). - -### 您可以自由地: +您可以自由地: - **共享** — 在任何媒介以任何形式复制、发行本作品 - - **演绎** — 修改、转换或以本作品为基础进行创作 - 只要你遵守许可协议条款,许可人就无法收回你的这些权利。 - ------- - -### 惟须遵守下列条件: +只要你遵守许可协议条款,许可人就无法收回你的这些权利。 +惟须遵守下列条件: - **署名** — 您必须给出[适当的署名](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#),提供指向本许可协议的链接,同时[标明是否(对原始作品)作了修改](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#)。您可以用任何合理的方式来署名,但是不得以任何方式暗示许可人为您或您的使用背书。 - **非商业性使用** — 您不得将本作品用于[商业目的](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#)。 - **相同方式共享** — 如果您再混合、转换或者基于本作品进行创作,您必须基于[与原先许可协议相同的许可协议](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#) 分发您贡献的作品。 -- **没有附加限制** — 您不得适用法律术语或者 [技术措施](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#) 从而限制其他人做许可协议允许的事情。 \ No newline at end of file +- **没有附加限制** — 您不得适用法律术语或者 [技术措施](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#) 从而限制其他人做许可协议允许的事情。 diff --git a/_config.yml b/_config.yml index 746f6fc..bf954fc 100644 --- a/_config.yml +++ b/_config.yml @@ -6,10 +6,10 @@ description: > Andrew Ng 著,Accepted Doge 译。 baseurl: "/machine-learning-yearning-cn" # the subpath of your site, e.g. /blog/ -url: https://accepteddoge.github.io/machine-learning-yearning-cn/ # the base hostname & protocol for your site -imgurl: https://accepteddoge.github.io/machine-learning-yearning-cn/img/ -git_address: https://github.com/accepteddoge/machine-learning-yearning-cn/ -git_edit_address: https://github.com/accepteddoge/machine-learning-yearning-cn/blob/master +url: https://deeplearning-ai.github.io/machine-learning-yearning-cn/ # the base hostname & protocol for your site +imgurl: https://deeplearning-ai.github.io/machine-learning-yearning-cn/img/ +git_address: https://github.com/deeplearning-ai/machine-learning-yearning-cn/ +git_edit_address: https://github.com/deeplearning-ai/machine-learning-yearning-cn/blob/master # theme options from https://bootswatch.com/ # comment out this to use default Bootstrap diff --git a/_docs/End-to-end deep learning/ch49.md b/_docs/End-to-end deep learning/ch49.md index f4dc0c3..5eff58b 100644 --- a/_docs/End-to-end deep learning/ch49.md +++ b/_docs/End-to-end deep learning/ch49.md @@ -14,7 +14,7 @@ permalink: /docs/ch49/ 这些人工设计的成分限制了语音系统的潜在性能,然而这样做也有一些优点: -- 频谱系数的特性对于处理一些不影响内容的音频属性是很有效的,比如说话者的音高。因此它们有助于讲话学习算法面临的问题。 +- 频谱系数的特性对于处理一些不影响内容的音频属性是很有效的,比如说话者的音高。因此它们有助于简化学习算法面临的问题。 - 在一定程度上,音素是一种合理的语音表示方法,它们也可以帮助学习算法理解基本的声音成分,从而提高其性能。 拥有更多的人工设计成分通常可以让语音系统学习更少的数据,由频谱系数和音素所捕获的人工设计的知识对算法从数据中获取的知识进行了补充。当我们的数据量不是很多时,这些知识是非常有用的。 @@ -25,10 +25,10 @@ permalink: /docs/ch49/ 这个系统缺乏人工设计知识,因此当训练集很小的时候,它的表现可能比人工设计的流水线更加糟糕。 -然而当训练集很大时,它不会收到频谱系数或者语音表示方法的限制。如果学习算法是一个足够大的神经网络,且喂进去许多的训练数据,就有可能做得更好,甚至达到最优错误率。 +然而当训练集很大时,它不会受到频谱系数或者语音表示方法的限制。如果学习算法是一个足够大的神经网络,且喂进去许多的训练数据,就有可能做得更好,甚至达到最优错误率。 端到端学习系统在 “两端” —— 输入端和输出端拥有大量标记数据时,往往做得更好。在这个例子中,我们需要一个大数据集(包含<音频,文本>对)。当这种类型的数据不可用时,使用端到端学习则需非常谨慎。 如果你正在研究一个训练集非常小的机器学习问题,那么算法的大部分知识都将来自于你的人类洞察力,即你的 “人工设计” 成分。 -如果不使用端到端系统,你将不得不决定在流水线中需要有哪些组件,以及它们应该如何连接在一起。在接下来的几章中,我们将对这类流水线的设计提出一些建议。 \ No newline at end of file +如果不使用端到端系统,你将不得不决定在流水线中需要有哪些组件,以及它们应该如何连接在一起。在接下来的几章中,我们将对这类流水线的设计提出一些建议。 diff --git a/_docs/Error analysis by parts/ch55.md b/_docs/Error analysis by parts/ch55.md index 4489d40..5eb9f96 100644 --- a/_docs/Error analysis by parts/ch55.md +++ b/_docs/Error analysis by parts/ch55.md @@ -11,7 +11,7 @@ permalink: /docs/ch55/ 1. 尝试人为修改 A 的输出为 “完美” 输出(例如,猫的 “完美” 边界框),并在此输出上运行流水线其余的 B,C 部分。 如果算法现在给出了正确的输出,那么这表明,只要 A 给出了更好的输出,那么整个算法的输出就是正确的;因此,你可以将此误差归因于组件 A. 否则,请继续执行步骤 2. 2. 尝试人为修改 B 的输出为 “完美” 输出。如果算法现在给出正确的输出,则将误差归因于组件 B. 否则,继续执行步骤 3. -3. 将误差归因于组件 B. +3. 将误差归因于组件 C. 让我们来看一个复杂一点的例子: @@ -39,4 +39,4 @@ B:检测汽车(以前是检测行人) C:规划汽车路径 -但是这个分析的结果仍然是有效的,并且可以很好地指导你把注意力集中在哪里。 \ No newline at end of file +但是这个分析的结果仍然是有效的,并且可以很好地指导你把注意力集中在哪里。 diff --git a/_docs/Setting up development and test sets/ch09.md b/_docs/Setting up development and test sets/ch09.md index c66da9a..9d7b637 100644 --- a/_docs/Setting up development and test sets/ch09.md +++ b/_docs/Setting up development and test sets/ch09.md @@ -23,6 +23,6 @@ $$ 如果要考虑 $ N $ 项不同的标准,比如模型的二进制文件大小(这对移动端 app 尤为重要,因为用户不想下载体积很大的 app)、运行时间和准确率,你或许需要设置 $ N-1 $ 个 “满意度” 指标,即先要求它们满足一定的值或范围,下一步才是定义一个 “优化” 指标。例如分别为二进制文件的大小和运行时间设定可接受的阈值,并尝试根据这些限制来优化准确率指标。 -最后再举一个例子,假设你正在设计一个硬件设备,该设备可以根据用户设置的特殊 “唤醒词” 来唤醒系统,类似于 Amazon Echo 的监听词为 “Alexa”,苹果(Apple) Siri 的监听词为 “Hey Siri”,安卓(Android) 的监听词为 “Okay Google”,以及百度(Baidu)应用的监听词 “Hello Baidu.” 我们关心的指标是假正例率(false positive rate)—— 用户没有说出唤醒词,系统却被唤醒了,以及假反例率(false negative rate)——用户说出了唤醒词,系统却没能正确被唤醒。这个系统的一个较为合理的优化对象是尝试去最小化假反例率(优化指标),减少用户说出唤醒词而系统却没能正确唤醒的发生率,同时设置约束为每 24 小时不超过一次误报(满意度指标)。 +最后再举一个例子,假设你正在设计一个硬件设备,该设备可以根据用户设置的特殊 “唤醒词” 来唤醒系统,类似于 Amazon Echo 的监听词为 “Alexa”,苹果(Apple) Siri 的监听词为 “Hey Siri”,安卓(Android) 的监听词为 “Okay Google”,以及百度(Baidu)应用的监听词 “Hello Baidu.” 我们关心的指标是假正例率(false positive rate,又译作假阳率,误诊率)—— 用户没有说出唤醒词,系统却被唤醒了,以及假反例率(false negative rate,又译作假阴率,漏诊率)——用户说出了唤醒词,系统却没能正确被唤醒。这个系统的一个较为合理的优化对象是尝试去最小化假反例率(优化指标),减少用户说出唤醒词而系统却没能正确唤醒的发生率,同时设置约束为每 24 小时不超过一次误报(满意度指标)。 一旦你的团队在优化评估指标上保持一致,他们将能够取得更快的进展。 diff --git a/_docs/index.md b/_docs/index.md index b5e3691..2139ccd 100644 --- a/_docs/index.md +++ b/_docs/index.md @@ -4,4 +4,34 @@ permalink: /docs/home/ redirect_from: /docs/index.html --- -机器学习训练秘籍属于 deeplearning.ai 项目,译者水平有限,如有翻译不当之处,恳请读者指正,联系邮箱: [acdoge.cao@gmail.com](mailto:acdoge.cao@gmail.com) \ No newline at end of file +当前样稿仅供内容预览,非最终版本(历史版本可以在 [release](https://github.com/deeplearning-ai/machine-learning-yearning-cn/releases) 中找到)。 + +## 合作改善翻译质量 + +译者水平有限,如有翻译不当之处,恳请读者帮助斧正,途径为: + +1. 在项目的 Issues 区创建新的讨论内容;(推荐) +2. 在网页点击 “改进当前页面”,修改后发起 Pull Request; +3. [发送邮件](mailto:xiaowei@deeplearning.ai) 进行反馈,主题带有 “MLY 翻译”。 + +注:所有图片放在 `img` 路径下,本地无法预览,在文稿中的插入方式为: +``` + +``` + +## 相关版权声明 + +本项目遵循 “署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)” 协议。这是一份普通人可以理解的[许可协议](https://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.zh-Hans)概要 (但不是替代) 。[免责声明](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#). + +您可以自由地: + +- **共享** — 在任何媒介以任何形式复制、发行本作品 +- **演绎** — 修改、转换或以本作品为基础进行创作 + +只要你遵守许可协议条款,许可人就无法收回你的这些权利。 +惟须遵守下列条件: + +- **署名** — 您必须给出[适当的署名](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#),提供指向本许可协议的链接,同时[标明是否(对原始作品)作了修改](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#)。您可以用任何合理的方式来署名,但是不得以任何方式暗示许可人为您或您的使用背书。 +- **非商业性使用** — 您不得将本作品用于[商业目的](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#)。 +- **相同方式共享** — 如果您再混合、转换或者基于本作品进行创作,您必须基于[与原先许可协议相同的许可协议](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#) 分发您贡献的作品。 +- **没有附加限制** — 您不得适用法律术语或者 [技术措施](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh#) 从而限制其他人做许可协议允许的事情。 diff --git a/_includes/footer.html b/_includes/footer.html index 0e79ea6..5310487 100644 --- a/_includes/footer.html +++ b/_includes/footer.html @@ -1,8 +1,8 @@ diff --git a/_includes/section_nav.html b/_includes/section_nav.html index 158bd0a..9ad655e 100644 --- a/_includes/section_nav.html +++ b/_includes/section_nav.html @@ -7,20 +7,20 @@ {% if forloop.first %} {% else %} {% assign previous = forloop.index0 | minus: 1 %} {% assign previous_page = docs[previous] | prepend:"/docs/" | append:"/" %} {% endif %} {% if forloop.last %} @@ -28,7 +28,7 @@ %} diff --git a/_includes/topnav.html b/_includes/topnav.html index 64836c1..f7b565e 100644 --- a/_includes/topnav.html +++ b/_includes/topnav.html @@ -13,8 +13,7 @@