十分钟搭建一个数据科学博客 创建博客的步骤

创建博客的步骤(十分钟搭建一个数据科学博客),小编带你了解更多信息 。

十分钟搭建一个数据科学博客 创建博客的步骤

文章插图
写博客是证明你的实力、深入学习和建立读者群的好方法 。有许多数据科学和编程类博客帮助他们的作者找到工作,或者认识了重要人物 。定期写博客是有抱负的程序员和数据科学家最应该做的事情之一 。
不幸的是,写博客的一大障碍就是先搭建一个博客网站 。在这篇文章中,我们将学习如何用 Python 创建一个博客网站,怎么用 Jupyter Notebook 写文章和如何通过 GitHub Pages 部署博客 。读完这篇文章,你就可以使用你熟悉的方式,创建自己的数据科学博客了 。
静态网站
基本上,一个静态网站就是一个全是 HTML 文件的文件夹 。我们可以搭建一个允许别人链接到这个文件夹并获取文件的服务器 。这样做的好处是不需要数据库或者其他动态部分,可以很简单的部署在像 GitHub 之类的网站上 。把你的博客做成静态网站是一个好主意,因为维护起来十分简单 。建立静态网站的一种方法是手写 HTML,然后上传所有的 HTML 文件到服务器 。这种情况下,你至少要写一个index.html文件 。如果你的网站的 URL 是thebestblog.com,当访问者浏览
http://www.thebestblog.com时,他们就会看到index.html的内容了 。HTML 的文件夹可能是下边的这个样子:
十分钟搭建一个数据科学博客 创建博客的步骤

文章插图
在上边的这个网站里,访问
http://www.thebestblog.com/first-post.html你就可以看到first-post.html的内容 。first-post.html可能是下边这个样子:
十分钟搭建一个数据科学博客 创建博客的步骤

文章插图
你可能会立马发现手工编辑 HTML 的一些问题:
  • 手工编辑 HTML 会很枯燥 。
  • 如果你想写多篇文章,你需要复制很多内容,比如样式、Title、Footer 等 。
  • 如果你想整合评论系统或者其他插件,你不得不写 Javascript 。
一般来说,你写博客的时候,想关注于博客内容,而不是在 HTML 上浪费时间 。谢天谢地,你可以用一个叫做静态网站生成器的工具来取代手动编辑 HTML 。
静态网站生成器
静态网站生成器可以让你用一些简单的格式写文章,通常是 Markdown,然后再定义一些设置 。生成器可以自动把你的文章转换为 HTMl 。使用静态网站生成器,你可以把first-post.html极大地简化为first-post.md:
十分钟搭建一个数据科学博客 创建博客的步骤

文章插图
这比处理 HTML 文件要简单的多!通用的元素,比如 Title 和 Footer,可以放在模板里边,这样很容易更改 。
静态网站生成器多种多样 。最流行的是用 Ruby 开发的 Jekyll 。因为我们要搭建一个数据科学博客,所以需要网站生成器可以处理 Jupyter Notebooks 。
Pelican 是一个用 Python 开发的网站生成器,可以接受 Jupyter Notebook 文件并转换成 HTML 博客文章 。Pelican 也可以很容易的把文章部署到 GitHub Pages 让别人阅读 。
安装 Pelican
开始之前,这里有一个仓库(repo),它就是我们最终成果的示例 。
如果你还没有安装 Python,在开始之前你还需要做一些前期工作 。这里有一些安装 Python 的说明 。我们建议使用 Python3.5 。当你安装完成 Python:
  • 创建一个文件夹——我们将把博客网站的内容和样式(Styles)放在这个文件夹里 。该教程把这个文件夹叫做jupyter-blog,你可以随便起名字 。
  • cd进入jupyter-blog文件夹 。
  • 创建一个叫.gitignore的文件,然后把这个文件里的内容加进去 。我们最后将要把仓库提交到 git,而这将会排除一些其他东西 。
  • 创建并激活一个虚拟环境 。
  • 在jupyter-blog文件夹里创建一个叫requirements.txt的文件,内容如下:
    十分钟搭建一个数据科学博客 创建博客的步骤

    文章插图
  • 在jupyter-blog文件夹里运行pip install -r requirements.txt来安装requirements.txt里边所有的包 。
创建数据科学博客
完成了前边的设置之后,你就做完创建博客的准备了!在jupyter-blog文件夹里运行pelican-quickstart命令,来为你的博客启动一个交互式安装序列 。你将看到一些帮助你设置博客属性的问题 。大多数问题你只需要点击Enter使用默认设置就好了 。你需要输入的就是你网站的名字、网站的作者,另外就是当问到 URL prefix(URL 前缀) 和 timezone(时区) 的时候选n 。下边是个例子: