在之前的这篇文章中:
- 来来来,给大家分享点有意思的数据 / Share some interesting data
我给大家分享了一些有意思的数据,全网信用最高的用户、SP最多的、粉丝最多的、到处粉人的.....
有朋友看后私下和我表示这些数据挺有意思,问我咋弄出来的。我回答说使用steemdata.com 筛选出来的,他对此表示很好奇,希望我能介绍一下steemdata.com所以,今天我在这里给大家简要介绍一下。
SteemData 是什么?
SteemData 简单的来讲,就是Steem区块链的数据库(MongoDB)镜像版本。
这个定义可能不甚准确,但是我自己觉得还算恰当。
Steem是去中心化的区块链,我们可以通过STEEMIT.com 或者Esteem、Busy.org、ChainBB工具或者站点与之交互,比如说发表帖子或者给别人的帖子投票等等。而如果我们要查找一些内容,则相对比较麻烦,比如在steemit上逐页翻阅、或者通过google.com 等工具的站点搜索,或者使用工具直接调用Steem API来查找。
以上无论是哪种方式,使用其它都有极大的局限性,尤其是在复杂的情况下。比如使用API我们可以查看@oflyhigh 的账户数据、看看他有多少SP。但是如果我们想看看所有持有SP数量大于1万个的,API就会无能为力了。所以SteemData 应运而生。
SteemData 由 @furion 发起并维护。
详情见发表于六个月之前的帖子
大致原理就是实时随时同步steem区块链的新数据,并存储到MongoDB中。没错,用的是MongoDB, NoSQL数据库类型的代表之一。至于NoSQL数据库有何优点等等话题本文就不做探讨啦。
SteemData 连接信息以及Collections
@furion 的上述帖子中列出了数据库的连接信息,但是有些老旧
欲获得最新的连接信息可以访问SteemData官方网站: https://steemdata.com/
撰写本文时,连接信息如下:
Host: mongo1.steemdata.com
Port: 27017
Database: SteemData
Username: steemit
Password: steemit
SteemData有如下collections
(可以近似理解成MySQL中的表格)
- Accounts
- Operations
- Account Operations
- Posts
- Comments
其中 Accounts 包含用户信息、Operations包含所有操作信息、Account Operations包含个账户相关的操作、Posts包含主贴信息、Comments包含回复信息。
如何操作SteemData
首先SteemData给用户开放的是只读的权限,这很正常,如果大家胡乱写,那就没法用了。SteemData的作者推荐大家使用 RoboMongo 一款MongoDB的图形界面工具来了解SteemData.
另外,SteemData 直接封装了一个Python 库: steemdata, 可以通过pip 安装
pip install -U steemdata
欲了解如何使用steemdata Python 库来访问SteemData,可以访问官网的入门向导页面
我使用的是pymongo
如果你还没有安装过它,你需要使用pip安装
pip install pymongo
使用下列命令连接并登陆
看一下都有哪些collections
咦,居然还有几个collections
官网页面上没有列出来
现在我们就开始我们的探索之旅啦。
查询声望分最高的10个用户
有了上述基础,你就可以做一些复杂的查询啦,比如说,查一下全网声望分最高的10个用户
是不是很简单的啦?
顺便恭喜一下这些获奖用户:
{'name': 'steemsports', 'rep': 77.83}
{'name': 'knozaki2015', 'rep': 77.2}
{'name': 'juliettal', 'rep': 76.64}
{'name': 'gavvet', 'rep': 76.62}
{'name': 'krnel', 'rep': 76.39}
{'name': 'ozchartart', 'rep': 76.02}
{'name': 'papa-pepper', 'rep': 75.27}
{'name': 'curie', 'rep': 75.17}
{'name': 'ericvancewalton', 'rep': 75.17}
{'name': 'doitvoluntarily', 'rep': 74.91}
参考连接
- Introducing SteemData - A Database Layer for STEEM
- Roadmap for SteemData 2.0 ∙ Crowdfunding
- SteemData 1.2 is here ∙ Raised $5,120 of $5,000 ∙ Now on GitHub
- Getting started with SteemData
- What is happening to SteemData?
- SteemData 1.3
Thanks @furion for providing steemdata service!
好了,今天就先介绍这些啦。
如果大家感兴趣,以后在介绍更多内容。
感谢阅读 / Thank you for reading.
欢迎upvote、resteem以及 following me @oflyhigh 😎
这里面的超链接引用形式不对,请修改更正。
感谢指正,已修改.😄
I found this post interesting. I think you did a good job
This comment has received a 0.13 % upvote from @booster thanks to: @hamzaoui.
你这些大招一教,现在大家都会搞开发了 :) 全网遍历目前没好的办法. 有统计过有多少贴子没?
独乐乐不如众乐乐
大家一起学一起玩
nice post, upvoted!please follow me
😄
This is very informative post . thank you for this @oflyhigh :)
You are welcome!
Very informative - thanks
Welcome😀
这种绝活 告诉我 我也不会
很简单的,只要用心,一学就会
Really This goes far beyond the commenting! It wrote his thoughts while reading the article amazingly :)
謝謝大神的獨門分享,要磨一下python了
好好学习天天向上
Steem data
nice project
i have first translated your article in english by an online service and then read it, its full of knowledge, excellent details are discussed
nice
好贴!信息量很大。正琢磨怎么搞个tool或者机器人。谢谢
哦,我是期待上榜。
加油,你是最棒的
大家加油。😎
this is actually nice. great job
i love chinese, any girl from china want to be friends or more ... plz contact
Congratulations @oflyhigh!
Your post was mentioned in my hit parade in the following category:
刚刚看到这个数据源,非常有意思。
可惜今天去看的时候说这个StemData九月一日就要关了
有没有其他的后备数据源呢?