phoenix 完整版,phoenix2

  

  

Phoenix:数据库管理系统的最佳新特性

  

  

  今天,Cloudera正式宣布将在CDH支持Apache Phoenix,同时它也将集成到未来的Cloudera数据平台中。   

  

  事实上,Cloudera的CDH发行版一直包含Apache HBase服务,该服务为希望利用大数据的客户的运营应用程序提供了一个灵活的NoSQL数据库。这些应用已经发展成为重要的、核心的应用,可以带动收入和利润的增长。这些应用包括面向客户的应用,电子商务平台,银行的风险控制和反欺诈,或者为应用提供AI/ML模型,根据实际效果进一步加强训练。   

  

  然而,对于许多客户来说,使用HBase实际上非常困难,因为:   

  

  1.1的数据模型。HBase是一个又大又宽的表,支持数百万列,但不支持join。   

  

  2.使用Java APIs而不是ANSI SQL   

  

  他们需要能够使用更传统的模式设计,类似于Oracle或MySQL提供的模式,并且愿意在灵活性方面做出一些折衷,例如:   

  

  1.他们愿意使用提供的数据类型,而不是定义自己的数据类型。   

  

  2.他们愿意放弃灵活性,让一个列有多种类型,这取决于行,以换取单行中的单一类型   

  

  为了方便客户拥有Apache HBase的其他优势(无限扩展、百万行、模式进化等。),同时提供类似RDBMS的功能(ANSI SQL、简单连接、开箱即用的数据类型等)。),我们在CDH上引入了对Apache Phoenix的支持。   

  

     

  

  如果HBase得到优化,基于Phoenix的应用也将受益,从而获得更好的性能。例如,Phoenix实现了主键的加盐——因此HBase的用户不必考虑Rowkey的设计。   

  

  此外,基于Phoenix的应用程序可以与HBase应用程序共存——这意味着您可以使用单个HBase集群来支持两者。有了Phoenix,客户可以继续使用他们喜欢的BI和dashboard工具,就像他们以前使用Hive和Impala一样。   

  

     

  

  在CDH,Phoenix从安全和治理的角度,使用HBase ACLs实现Phoenix表的基于角色的访问控制。同时,Cloudera Navigatior还会抓取凤凰的审计信息。   

  

  现在Cloudera主要发布基于CDH5.16.2的Phoenix4.14.1包包,很快我们也会发布CDH6.2的Phoenix5.0包包,因为C6的HBase已经是2.x了,所以会有所不同。   

  

  事实上,现有的HDP客户可以随时享受Apache Phoenix的技术支持。几乎一半使用HDP的HBase用户都在使用Phoenix,Phoenix在HBase用户群体中也很受欢迎。   

  

  要使用Apache Phoenix构建核心应用程序,请单击以下链接下载Phoenix:   

  

  https://www.cloudera.com/downloads/phoenix.html

常见问题

  

  

  Q)Phoenix适用于什么样的工作负载   

  

  Phoenix支持与HBase相同的用例场景,主要是低延迟和高并发工作负载。然而,Phoenix也可以更容易地利用仪表板和BI应用程序的底层数据。   

  

  Q) Phoenix的授权机制是什么?   

  

  凤凰依靠HBase的授权机制。对于CDH客户,可以使用HBase ACL。对于HDP客户,可以使用Ranger。   

  

  Q) Phoenix的可扩展性怎样?已知的最大的集群是哪个?   

  

  Phoenix可以扩展到数百TB的数据。最大的客户有超过0.5 PB的数据,由凤凰管理。此用例的详细信息可在PhoenixCon档案中找到:   

  

  今年早些时候,用户还可以在自己的NoSQL日视频中观看https://phoenix.apache.org/phoenixcon-archives.html:   

  

  https://www.youtube.com/playlist?list=plsaikuajre 2 l 6 if 7 az 2 phid 8 vsjly 9 chQ) Phoenix是否支持地理空间二级索引?支持什么级别的空间数据?   

  

  它对地理空间数据的支持是有限的。GeoMesa在HBase上提供了一个地理空间层,可以支持这一需求,并与客户应用集成。Phoenix、GeoMesa、JanusGraph和OpenTSDB都可以共存于一个HBase集群中。   

  

  Q) 如何创建和使用索引?   

  

  有关索引的更多信息,请参考Phoenix二级索引页面。   

  

  从https://phoenix.apache.org/secondary_indexing.html凤凰4.8.0开始,使用本地索引不需要任何配置。   

  

  Q) 做索引的column数量有限制吗?   

  

  和RDBMS一样,HBase的二级索引实际上是通过使用另一个索引表来实现的,这个索引表包含了索引和源数据之间的链接。如果索引所有列,维护成本会大大增加。对于索引的选择,也要考虑多读少写。可以考虑全局索引,写的多读的少,可以考虑局部索引。   

相关文章