区块链行业应该如何分辨数据的优劣?

对于咨询行业,区块链行业如此多的数据该如何处理,你怎么样保护你自己作为传播者的可信度?

火星财经(微信:hxcj24h)一线报道,北京时间22日在新加坡举行的币安峰会上,Forkast.News创始人兼CEO AngieLau主持了“Why the Quality of Information Matters: Separating Good from Bad”的圆桌讨论,参与嘉宾还包括Etherscan的CEO MatthewTan,Longhash的联合创始人Emily Parker,Chainalysis业务发展主管Ulisse Dellorto。

区块链行业应该如何分辨数据的优劣?

以下为对话实录,根据录音整理,略有编辑:

Angie Lau

我们其实都有见过面,在网上,大家从不同的地方打电话进来,当时我们有谈到,这个非常重要的我们行业的一个组成部分。所以首先我想了解你们每个人在行业中的角色,你们所做的事情,外界这么多的数据,你们是怎么样看待的?它对你们在公司内的角色有什么样的作用?

Emily Parker

确实有很多的数据,特别是在加密货币行业和区块链行业。而区块链有一个好处,很多的数据是透明的。但问题是,普通投资者并不知道怎样去解读这些数据,所以我们要做的并不仅仅是展示这个数据,分析的数据,我们要从中提取出它的趋势讲成故事,让普通的投资者知道这些数据意味着什么,并了解数据背后隐含的东西。

Angie Lau

你对于数据是怎么看待?

Ulisse Dellorto

我们对区块链中手动检查的数据与人工智能和算法生成的数据进行了区分。当我们看区块链数据的时候,主要是通过几步来采集,第一步是先看几个同样输入的集群;第二个是行为数据,不光是地址的结构,而且要看交易的发生的时间等等;第三是专有来源有关,比如开源数据等等。因为有些数据是手工采集的,有些数据是用人工智能采集的,这两者的区块区分开还是挺重要的,我们需要结合两类数据才能够得出最准确的结论。

Matthew Tan

我是Matthew来自Etherscan,除了刚才两位说的,我补充一点,当我看数据的时候,我是把数据分成两部分,一是数据,另外则是信息,我将这两者区分开来。往往人们把这数据和信息混为一谈,但是有些数据只是一些碎片的信息。我一般把数据再分成原始数据,也就是没有完全处理的数据,这种原始数据输入到组织里面,组织对这些数据进行分析,然后分解成为公众更能够理解和消化的数据,所以数据的提供者除了这个数据的来源机构之外,还有提炼者。

Angie Lau

我完全同意你们的说法。我过去20年来一直在媒体行业做记者,Emily和我的兴趣相同,我们本质上都是从事新闻的,你说的很对,数据是核心所在,在彭博社的时候我们总是非常的强调数据,数据是不会撒谎的。但是数据背后的背景则是模糊的,这就是信息的质量和信息的提供者的重要性,他们是否能够提供客观清晰的信息非常的关键。

实际上这个行业里有很多不好的行为,甚至一些很可靠的平台,也不可避免有一些不妥的处理方式。那你们每个人是怎么样从通过自己的协议和平台,来区分好的数据信息和差的数据信息呢?

Emily Parker

没错,最近确实对加密媒体的批评也很多,可能因为整个加密货币行业都比较的新,所以很多人认为加密媒体不可靠。你刚才说到追溯数据的源头很重要,当然数据本身有可能就不正确,这个常常发生。有一些数据来源比较可靠,而有一些数据网站则非常的不靠谱,我们都积累起了经验,比如说Etherscan是相对来说比较可靠的一个网站,而其他一些平台我就不在这里点名了,都是大家都知道不是很靠谱。所以你首先要找到可靠的来源。关于区块链和加密货币世界的一个好处在于,它是一个去中心化和开源的数据,如果发现假数据,或错误数据,很快就会有人给你指出来。如果有问题的话,你很快的就能得到反馈,所以我觉得这个非常的好。

另外加密货币媒体的一个大问题是可信度,人们对很多媒体的网站和平台的印象是,他们是有立场的,甚至是在背后收了钱的。我们力图保持中立,保持客观,避免带着自己的意图目的去提供这些内容。当读者看加密媒体上的一些分析文章,他们也会想这些文章自身是不是有明显的立场,它是不是中立。我觉得作为媒体你是要保持中立的。

Angie Lau

是的,数据的质量非常的关键,那你们怎么区分?如果数据信息来源就是垃圾的话,你当然不可能把垃圾做成美味佳肴,所以你们怎么样区分信息优劣?

Ulisse Dellorto

虽然区块链的性质能给我们很多历史数据,这些数据历史数据也不会被抹除,但是不要忘记,大部分的数据和交易都是在交易所发生的,而交易所数据由于安全的考量也是在不断的滚动,所以最好是有一个持续的工作来识别局集群。如果你不像我们这样不断地做研究的话,比如说我们有技术人员常年在做这种研究,只有这样才能真正的跟踪清楚。所以我觉得做调查研究很重要,还要去分类不同的实体和他们在区块链上的活动。你要能够及时的发现一些信号、迹象,所以区块链就是它的不光是信息的来源,让你可以去用的信息,而是你自己也需要不断的去分析去跟踪。

Angie Lau

没错,我们都在传播信息,但重要的是行动,也就是说你要去调查,你要去做这种研究调查,才能够透过迷雾看到真正发生的事情。Matthew Tan你们对待数据的理解好像跟其他人也不太一样。

Matthew Tan

每次我看到数据的时候,我总是先把它分解开来。区块链数据呢,它整个数据库都可以下载在电脑上,所以你很容易去验证原始数据是不是准确。这是一个很基础的事情,然后在更高的一个层面上,你要去分析。就像Emily刚才说的,个人来讲,假如说我现在看到这个信息,我先会问自己几个问题,比如说来自某一个源头的信息,我会看他是不是有什么动机的。我希望这个来源当然最好是独立的,也就是说他没有偏颇,他没有背后的金钱的动机来扭曲他的报道,或他的陈述。如果他是一个独立的信息提供方,那就相对来说比较可靠。你看很多数据的提供者,他们总是说他们是免费提供这些数据的,但是你如果仔细挖掘的话,你会发现这些数据背后是有一些财力在支持的,也许是某个代币项目或者是有一些服务等等,我就会觉得他不是真的很独立的。他的呈现的信息,它所讲述的这个故事可能是有偏颇的,它可能引导你往某个方向去理解。

Angie Lau

从读者的角度来说,有时候看数据本身质量还是不错的,你怎么样保护你自己作为传播者的可信度呢?

Matthew Tan

我个人认为,我们在Etherscan做的事情我还是比较满意的。我们很清楚的一个政策是我们不发币,不做ICO,没有钱包,otc或者是交易所业务,所以我们能给用户提供的只有信息,我们要尽量追求资讯无限接近真相。

Angie Lau

读者和整个媒体行业都必须理解,大众也是一个整体,包括对大众的这种情绪、观感的分析也是很重要的,也让投资者更好地能够理解客户。

Emily Parker

公众情绪的分析,我觉得在加密技术行业这个群体的态度分析确实很重要。比如说比特币比特币的价格完全取决于有多少人愿意买他,加密货币的价格是由整个群体决定的,所以你当然就需要去了解这个群体的态度。我们会去分析推特上的用户的态度,分析推文看他们是正面的还是负面的,还会去对他的情绪打分,比如说它是非常正面的还是稍微正面等等。所以我们有一套标准,但这些标准你可能说不够科学,但我认为在加密货币行业,公众群体的态度是值得去分析的。这里我想说一下,这个也要看监管的立场。尤其是我们生活在监管不确定的环境下,大部分地区对加密货币的监管还是不清晰的,也没有一个全球统一的监管措施,可以说这个行业还处在婴儿期。所以市场的波动肯定是会有的。在这种情况下,你对情绪的分析就尤为重要了。我觉得这是一个非常微妙的话题,尤其是看一些开放源的信息,这也是我们分析的对象。除此之外,比较重视的是来自投资行为的数据,看投资者是如何的影响市场等等。

区块链行业应该如何分辨数据的优劣?

Angie Lau

大家讲的监管,这很好,我也要说它不一定很科学,但是影响价格波动的一个很直接的因素就是对监管的恐惧。每当政府官方人士谈到加密货币的负面信息的时候,它的价格就会直接受到影响,所以我同意监管态度确实是需要去分析和重视的。我同意加密资产的价格的波动,一个直接因素是人们的信心。最早的时候,交易比特币是为了买比萨,而现在加密货币的用途与远远超过了这个。有人提出一个问题,加密货币最终能生存下去吗?看各国政府的态度,有些政府是非常负面的,所以人们肯定要关注。关于市场的情绪,可能我是在总结他们两位所说的,我们看到这个词情绪到处大家都在讲到底它意味着什么?它有什么内在价值。

Matthew Tan

从我的角度来说,我觉得人们唯一感兴趣的情绪分析就是市场情绪分析,就是说大家想要知道市场的发展方向,这其实都是跟钱有关的。人们想用这些工具来去估算市场的方向,所以从我们的角度来说,我们可能做很多的链上的数据分析,比如说活跃的用户的交易额,交易次数等等。这些都是非常原始的数据,人们也使用不同的数据源,有从新闻上面所获取的数据,想放到一个特殊的数据分析平台上来分析市场的走向,然后使用这个信息来执行交易。

Angie Lau

是的,我同意这样一个观点,但是我觉得这个上面还有另外一层市场情绪,有的时候是政治影响,市场的情绪非常重要,它会推动法律立法的发展方向。

Ulisse Dellorto

确实是这样,但现在还主要由金融推动的,也许有一小部分已经达到了你所谈的情况,但是我觉得对大众来说,其实就是由财务的刺激激励。在2018年可能大家用分析工具想要去知道市场发展的方向,这是由财务所推动的这样的一个动机,这是我的看法。

Angie Lau

确实,如果缺少财务的激励的话,市场情绪会有什么影响我不知道,但是让我们来看一下不同的工具,不同分析数据的方式,你们是怎么样做的?能否给我们提供一些想法?

Emily Parker

那我们有几个特别的工具,具体的工具,像我们刚才提到的,比如说在twitter的分析追踪。我们可能把一个比特币的地址放进去,然后看它的交易的历史,有没有和一些洗钱的历史相关。当然这不会暴露地址的身份,只是看他的交易历史就可以知道有没有我们需要的东西。为什么这么做?因为我们想让虚拟货币被主流接受的话,就要创造更多的信任感。人们要知道他和犯罪行动没有太大的联系,当然我们也要去看一看,Tether和Bitcoin之间的联系。我想更最重要的一点,是想要去讲一讲数据背后的故事。因为我所观察到的一件事情是,通常数据科学家的世界和讲故事人的世界是分割的。记者和讲故事的人,对数据不是很在乎,而数据科学家对数据很在乎,但是他们不知道怎么样去分析数据背后的趋势,这个其实是媒体的领域,我觉得非常兴奋的就是把这两个世界相结合,来讲出关于数据的很多的故事,这个是媒体需要关注的。

Matthew Tan

我觉得我们也要确保大家都了解区块链,它只是有限的数据。在分析区块链的时候,我们看到很多的地址,但是你不知道这个地址背后的人是谁,将这些地址进行分组之后,他就可以给执法机构很多的手段去侦测这些洗钱的行为,阻止犯罪行为的进行。其中我们有个工具叫Reactor,专注于给执法机构收集、调查数据。第二个是一个特殊的合规解决方案,第一个功能是交易的监控,能够实时的监控存取的是否合法的;第二个就是对客户的评分,不透露任何客户的KYC信息就可以获取一个分数。

非常好,我想当你谈到这个研究的话要回到基本面,传统的研究的话有两类,一类是定性的,一类是定量的。定量上有很多原始数据,定性上面有很多客户的反馈,把不同类别的行业的服务合并起来就可以看到很多的趋势。

Angie Lau

我想说你们有最好的工具,它可以闻到一些可疑的事情,所以你要从智慧的角度,保持好奇心,更好的去了解这个背景,有这样的一个意识在大脑中一直去思考。感谢各位嘉宾来分享对于信息质量的这样的一些洞见。

转载声明:本文 由CoinON抓取收录,观点仅代表作者本人,不代表CoinON资讯立场,CoinON不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。若以此作为投资依据,请自行承担全部责任。

声明:图文来源于网络,如有侵权请联系删除

风险提示:投资有风险,入市需谨慎。本资讯不作为投资理财建议。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2019年1月24日 下午12:51
下一篇 2019年1月24日 下午12:52

相关推荐

区块链行业应该如何分辨数据的优劣?

星期四 2019-01-24 12:51:56

火星财经(微信:hxcj24h)一线报道,北京时间22日在新加坡举行的币安峰会上,Forkast.News创始人兼CEO AngieLau主持了“Why the Quality of Information Matters: Separating Good from Bad”的圆桌讨论,参与嘉宾还包括Etherscan的CEO MatthewTan,Longhash的联合创始人Emily Parker,Chainalysis业务发展主管Ulisse Dellorto。

区块链行业应该如何分辨数据的优劣?

以下为对话实录,根据录音整理,略有编辑:

Angie Lau

我们其实都有见过面,在网上,大家从不同的地方打电话进来,当时我们有谈到,这个非常重要的我们行业的一个组成部分。所以首先我想了解你们每个人在行业中的角色,你们所做的事情,外界这么多的数据,你们是怎么样看待的?它对你们在公司内的角色有什么样的作用?

Emily Parker

确实有很多的数据,特别是在加密货币行业和区块链行业。而区块链有一个好处,很多的数据是透明的。但问题是,普通投资者并不知道怎样去解读这些数据,所以我们要做的并不仅仅是展示这个数据,分析的数据,我们要从中提取出它的趋势讲成故事,让普通的投资者知道这些数据意味着什么,并了解数据背后隐含的东西。

Angie Lau

你对于数据是怎么看待?

Ulisse Dellorto

我们对区块链中手动检查的数据与人工智能和算法生成的数据进行了区分。当我们看区块链数据的时候,主要是通过几步来采集,第一步是先看几个同样输入的集群;第二个是行为数据,不光是地址的结构,而且要看交易的发生的时间等等;第三是专有来源有关,比如开源数据等等。因为有些数据是手工采集的,有些数据是用人工智能采集的,这两者的区块区分开还是挺重要的,我们需要结合两类数据才能够得出最准确的结论。

Matthew Tan

我是Matthew来自Etherscan,除了刚才两位说的,我补充一点,当我看数据的时候,我是把数据分成两部分,一是数据,另外则是信息,我将这两者区分开来。往往人们把这数据和信息混为一谈,但是有些数据只是一些碎片的信息。我一般把数据再分成原始数据,也就是没有完全处理的数据,这种原始数据输入到组织里面,组织对这些数据进行分析,然后分解成为公众更能够理解和消化的数据,所以数据的提供者除了这个数据的来源机构之外,还有提炼者。

Angie Lau

我完全同意你们的说法。我过去20年来一直在媒体行业做记者,Emily和我的兴趣相同,我们本质上都是从事新闻的,你说的很对,数据是核心所在,在彭博社的时候我们总是非常的强调数据,数据是不会撒谎的。但是数据背后的背景则是模糊的,这就是信息的质量和信息的提供者的重要性,他们是否能够提供客观清晰的信息非常的关键。

实际上这个行业里有很多不好的行为,甚至一些很可靠的平台,也不可避免有一些不妥的处理方式。那你们每个人是怎么样从通过自己的协议和平台,来区分好的数据信息和差的数据信息呢?

Emily Parker

没错,最近确实对加密媒体的批评也很多,可能因为整个加密货币行业都比较的新,所以很多人认为加密媒体不可靠。你刚才说到追溯数据的源头很重要,当然数据本身有可能就不正确,这个常常发生。有一些数据来源比较可靠,而有一些数据网站则非常的不靠谱,我们都积累起了经验,比如说Etherscan是相对来说比较可靠的一个网站,而其他一些平台我就不在这里点名了,都是大家都知道不是很靠谱。所以你首先要找到可靠的来源。关于区块链和加密货币世界的一个好处在于,它是一个去中心化和开源的数据,如果发现假数据,或错误数据,很快就会有人给你指出来。如果有问题的话,你很快的就能得到反馈,所以我觉得这个非常的好。

另外加密货币媒体的一个大问题是可信度,人们对很多媒体的网站和平台的印象是,他们是有立场的,甚至是在背后收了钱的。我们力图保持中立,保持客观,避免带着自己的意图目的去提供这些内容。当读者看加密媒体上的一些分析文章,他们也会想这些文章自身是不是有明显的立场,它是不是中立。我觉得作为媒体你是要保持中立的。

Angie Lau

是的,数据的质量非常的关键,那你们怎么区分?如果数据信息来源就是垃圾的话,你当然不可能把垃圾做成美味佳肴,所以你们怎么样区分信息优劣?

Ulisse Dellorto

虽然区块链的性质能给我们很多历史数据,这些数据历史数据也不会被抹除,但是不要忘记,大部分的数据和交易都是在交易所发生的,而交易所数据由于安全的考量也是在不断的滚动,所以最好是有一个持续的工作来识别局集群。如果你不像我们这样不断地做研究的话,比如说我们有技术人员常年在做这种研究,只有这样才能真正的跟踪清楚。所以我觉得做调查研究很重要,还要去分类不同的实体和他们在区块链上的活动。你要能够及时的发现一些信号、迹象,所以区块链就是它的不光是信息的来源,让你可以去用的信息,而是你自己也需要不断的去分析去跟踪。

Angie Lau

没错,我们都在传播信息,但重要的是行动,也就是说你要去调查,你要去做这种研究调查,才能够透过迷雾看到真正发生的事情。Matthew Tan你们对待数据的理解好像跟其他人也不太一样。

Matthew Tan

每次我看到数据的时候,我总是先把它分解开来。区块链数据呢,它整个数据库都可以下载在电脑上,所以你很容易去验证原始数据是不是准确。这是一个很基础的事情,然后在更高的一个层面上,你要去分析。就像Emily刚才说的,个人来讲,假如说我现在看到这个信息,我先会问自己几个问题,比如说来自某一个源头的信息,我会看他是不是有什么动机的。我希望这个来源当然最好是独立的,也就是说他没有偏颇,他没有背后的金钱的动机来扭曲他的报道,或他的陈述。如果他是一个独立的信息提供方,那就相对来说比较可靠。你看很多数据的提供者,他们总是说他们是免费提供这些数据的,但是你如果仔细挖掘的话,你会发现这些数据背后是有一些财力在支持的,也许是某个代币项目或者是有一些服务等等,我就会觉得他不是真的很独立的。他的呈现的信息,它所讲述的这个故事可能是有偏颇的,它可能引导你往某个方向去理解。

Angie Lau

从读者的角度来说,有时候看数据本身质量还是不错的,你怎么样保护你自己作为传播者的可信度呢?

Matthew Tan

我个人认为,我们在Etherscan做的事情我还是比较满意的。我们很清楚的一个政策是我们不发币,不做ICO,没有钱包,otc或者是交易所业务,所以我们能给用户提供的只有信息,我们要尽量追求资讯无限接近真相。

Angie Lau

读者和整个媒体行业都必须理解,大众也是一个整体,包括对大众的这种情绪、观感的分析也是很重要的,也让投资者更好地能够理解客户。

Emily Parker

公众情绪的分析,我觉得在加密技术行业这个群体的态度分析确实很重要。比如说比特币比特币的价格完全取决于有多少人愿意买他,加密货币的价格是由整个群体决定的,所以你当然就需要去了解这个群体的态度。我们会去分析推特上的用户的态度,分析推文看他们是正面的还是负面的,还会去对他的情绪打分,比如说它是非常正面的还是稍微正面等等。所以我们有一套标准,但这些标准你可能说不够科学,但我认为在加密货币行业,公众群体的态度是值得去分析的。这里我想说一下,这个也要看监管的立场。尤其是我们生活在监管不确定的环境下,大部分地区对加密货币的监管还是不清晰的,也没有一个全球统一的监管措施,可以说这个行业还处在婴儿期。所以市场的波动肯定是会有的。在这种情况下,你对情绪的分析就尤为重要了。我觉得这是一个非常微妙的话题,尤其是看一些开放源的信息,这也是我们分析的对象。除此之外,比较重视的是来自投资行为的数据,看投资者是如何的影响市场等等。

区块链行业应该如何分辨数据的优劣?

Angie Lau

大家讲的监管,这很好,我也要说它不一定很科学,但是影响价格波动的一个很直接的因素就是对监管的恐惧。每当政府官方人士谈到加密货币的负面信息的时候,它的价格就会直接受到影响,所以我同意监管态度确实是需要去分析和重视的。我同意加密资产的价格的波动,一个直接因素是人们的信心。最早的时候,交易比特币是为了买比萨,而现在加密货币的用途与远远超过了这个。有人提出一个问题,加密货币最终能生存下去吗?看各国政府的态度,有些政府是非常负面的,所以人们肯定要关注。关于市场的情绪,可能我是在总结他们两位所说的,我们看到这个词情绪到处大家都在讲到底它意味着什么?它有什么内在价值。

Matthew Tan

从我的角度来说,我觉得人们唯一感兴趣的情绪分析就是市场情绪分析,就是说大家想要知道市场的发展方向,这其实都是跟钱有关的。人们想用这些工具来去估算市场的方向,所以从我们的角度来说,我们可能做很多的链上的数据分析,比如说活跃的用户的交易额,交易次数等等。这些都是非常原始的数据,人们也使用不同的数据源,有从新闻上面所获取的数据,想放到一个特殊的数据分析平台上来分析市场的走向,然后使用这个信息来执行交易。

Angie Lau

是的,我同意这样一个观点,但是我觉得这个上面还有另外一层市场情绪,有的时候是政治影响,市场的情绪非常重要,它会推动法律立法的发展方向。

Ulisse Dellorto

确实是这样,但现在还主要由金融推动的,也许有一小部分已经达到了你所谈的情况,但是我觉得对大众来说,其实就是由财务的刺激激励。在2018年可能大家用分析工具想要去知道市场发展的方向,这是由财务所推动的这样的一个动机,这是我的看法。

Angie Lau

确实,如果缺少财务的激励的话,市场情绪会有什么影响我不知道,但是让我们来看一下不同的工具,不同分析数据的方式,你们是怎么样做的?能否给我们提供一些想法?

Emily Parker

那我们有几个特别的工具,具体的工具,像我们刚才提到的,比如说在twitter的分析追踪。我们可能把一个比特币的地址放进去,然后看它的交易的历史,有没有和一些洗钱的历史相关。当然这不会暴露地址的身份,只是看他的交易历史就可以知道有没有我们需要的东西。为什么这么做?因为我们想让虚拟货币被主流接受的话,就要创造更多的信任感。人们要知道他和犯罪行动没有太大的联系,当然我们也要去看一看,Tether和Bitcoin之间的联系。我想更最重要的一点,是想要去讲一讲数据背后的故事。因为我所观察到的一件事情是,通常数据科学家的世界和讲故事人的世界是分割的。记者和讲故事的人,对数据不是很在乎,而数据科学家对数据很在乎,但是他们不知道怎么样去分析数据背后的趋势,这个其实是媒体的领域,我觉得非常兴奋的就是把这两个世界相结合,来讲出关于数据的很多的故事,这个是媒体需要关注的。

Matthew Tan

我觉得我们也要确保大家都了解区块链,它只是有限的数据。在分析区块链的时候,我们看到很多的地址,但是你不知道这个地址背后的人是谁,将这些地址进行分组之后,他就可以给执法机构很多的手段去侦测这些洗钱的行为,阻止犯罪行为的进行。其中我们有个工具叫Reactor,专注于给执法机构收集、调查数据。第二个是一个特殊的合规解决方案,第一个功能是交易的监控,能够实时的监控存取的是否合法的;第二个就是对客户的评分,不透露任何客户的KYC信息就可以获取一个分数。

非常好,我想当你谈到这个研究的话要回到基本面,传统的研究的话有两类,一类是定性的,一类是定量的。定量上有很多原始数据,定性上面有很多客户的反馈,把不同类别的行业的服务合并起来就可以看到很多的趋势。

Angie Lau

我想说你们有最好的工具,它可以闻到一些可疑的事情,所以你要从智慧的角度,保持好奇心,更好的去了解这个背景,有这样的一个意识在大脑中一直去思考。感谢各位嘉宾来分享对于信息质量的这样的一些洞见。