quantopian系列—Self-Serve Data( 三 )
- 公共URL形式
一个常见的错误是尝试使用共享文件网页(例如 , 如果您使用Dropbox , 则为 , 而不是可下载的 URL () 。 验证您是否拥有可下载的csv URL 的最佳方法是尝试在浏览器中打开该 URL 。 如果csv在您的网络浏览器中渲染 , 您没有使用正确的url格式 。 如果您使用的是下载网址 , 您的浏览器应该会为您下载该文件 。
你也可以检查你本地python环境中的ContentType 。
文章插图
对于像S3和GoogleStorage这样的一般访问文件提供商 , 你可能需要配置服务 , 以服务于适当的 "text/csv "头的ContentType 。
- 从google sheets中上传
- 点击 "文件">"发布到网络" 。
- 将 "网页 "选项更改为 "逗号分隔的值(.csv)" 。
- 点击 "发布 "按钮 。
- 复制并粘贴格式类似于 ;single=true&output=csv 的 URL 。
- 从Dropbox上传
- 最终确定你的实时数据集
检查上传状态您可以通过在自定义数据集仪表板的状态栏上鼠标移动来监控数据集的状态 , 这将浮现最后一次加载尝试的时间戳和任何错误信息 。
要对数据集负载进行更详细的分析 , 您可以利用Research中的load_metrics 。 load_metrics允许您检查历史上传和每日实时上传到所有自定义数据集的状态 。 您可以使用 load_metrics 来检查您所有自定义数据集的上传状态 , 就像这样 。
文章插图
在上面的例子中 , lm是一个DataFrame , 包含以下几列:
filenames_downloaded: 被Quantopian下载的文件名称 。
rows_received: 从历史数据或其他数据中下载的原始行数 。 从历史或实时端点(FTP、Google Sheets、Dropbox)下载的原始行总数 。
rows_added: 添加到基础数据集表中的新记录数(按资产/每天的符号映射和重复数据化后) 。
total_rows: 总行数 。 代表原始上传数据的总行数 。
delta_rows_added: 代表对之前上传的记录进行更新的新记录数 。 如果之前的记录已经以相同的主要日期和主要资产更新 , 则该记录被认为是更新 。
total_delta_rows:加载完成后 , 代表对之前上传的记录进行更新的记录总数 。
timestamp:下载的开始时间 。
time_elapsed: 处理数据的秒数 。
last_updated:最后更新的时间 。 对于实时负载 , last_updated代表记录的最大时间戳 , 代表最初报告的数据(不包括更新记录) 。 对于历史负载 , last_updated代表历史负载完成的时间 。
source_last_updated:在源FTP文件上最后修改的时间戳(仅指实时加载) 。
status: 负载的状态 。 可以是[running, empty (no data to process), failed, completed]中的任何一种 。
error:运行失败时的错误信息 。
run_type:运行的类型 。 返回 "live "或 "historical" 。 对于查找重新添加的数据集的第一次加载尝试很有用 。
获取你的自定义数据一旦您使用Self-Serve上传了一个自定义数据集到Quantopian , 您可以通过点击Self-Serve数据页面上的数据集名称 , 导航到您的自定义数据集的自动生成的文档页面 。 这个页面只有你可以查看 , 它包括第一次加载日期和在Pipeline中使用数据集的代码样本 , 以帮助你开始 。
与其他Pipeline数据集一样 , 自定义数据集是作为Pipeline数据集导入的 , 你在上传中指定的每个值列都有一个BoundColumn属性 。 重要的是 , Pipeline中没有关于自定义数据集的特殊属性 , 这意味着你可以像使用任何预集成的DataSet或BoundColumn一样使用它们 。
- 看不上|为什么还有用户看不上华为Mate40系列来看看内行人怎么说
- 采用|消息称一加9系列将推出三款新机,新增一加9E
- 世代|Z星球——腾讯布局Z世代教育社交的新尝试
- 脉搏|把握时代发展脉搏,尽展巴蜀版权风采——2020年成都数字版权交易博览会成功举办
- 系列|首销300000台!红米Note 9系列,或许可以说恭喜你了?
- 系列|联想碰瓷Redmi后正式复活乐檬手机!乐檬K12系列即将到来
- 系列|Redmi Note9系列三剑客来袭,差别到底有多大?该如何选择?
- 超强|RedmiNote9系列发布!天玑800U赋予超强5G性能
- 回顾|华为P系列回顾
- 情况|刚发布就卖出30万台:红米Note9系列稳了,销售情况追赶前代