�� LinkedIn ��ݴ��ѧϰ��ݼܹ�-��ƿ��

�� LinkedIn ��ݴ��ѧϰ��ݼܹ�

2017-06-02 1457

��Ȩ

��Ȩ��

��ɰ��ʵ��ע��û��Է��ף��Ȩ��ԭ��У��ƿ��ӵ��Ȩ��಻�е��Ӧ��Ρ��鿴�� ƿ��û��Э�� ƿ��֪ʶ��Ȩ��ָ��ֱ��ӳ�Ϯ��ݣ��д ��ȨͶ�߱��оٱ��һ��ʵ��ɾ��Ȩ��ݡ�

��飺

2000Ԫ��ƴ��ȯ��ȡ��2��4G�Ʒ��664Ԫ/3�꣬��û��Żݣ��>>>

��Ʋɹ��223Ԫ/3�꣩���ڣ��>>>��

��ѧ��9.5Ԫ/�£��ڣ��>>>��

LinkedIn.com�ǵ��е�רҵ�罻��վ֮һ��LinkedIn.com��ι��ݵġ��еĹ۵��©�Ĳ��ʱ��ҡ�

LinkedIn.com��

��һЩ��LinkedIn��ҳʱ��Ѿ��ˡ�

��º�ĸ��Ϻ󼸺��ʵʱ�ĳ��Ƹ��ҳ��
��º�ĸ��Ϻ󼸺��ʵʱ�ĳ��ҳ
��һ��£��Խ�ʵʱ�ĳ��feedҳ��
Ȼ��µ��ֻ��ҳ�棬��ʶ��ˡ��ϵ��ˡ��ȡ�

��𾪵��ǣ��ʹ�ýϺõĿ��Щҳ��ɼ��أ��LinkedIn��ʦ�Ŷ��¾��

��ڵ�LinkedIn��ݼܹ�

��˾һ��LinkedIn ��Ҳ��ͨ��RDBMS ��ϵ��ݿ��ϵͳ��ļ��ű��û��Ϻ��ϵ��ǲ��Ǻ�ԭʼ��RDMBS��չ��ݿ�ϵͳ��һ��֧��û�� ϵ�ȫ��һ��ʵ��罻ͼ��ݿ�ͨ��Databus��ȡ��ݡ�Databus��һ��仯��׽ϵͳ��ҪĿ��ǲ�׽��Щ�� Դ��Oracle��ݼ��ı��Ұ��Щ�仯��µ��ݿ�ϵͳ�С�

��ǣ�û��ּܹ��Ѿ��վ��ˡ��Ϊ��Brewerd��CAP��Ҫͬʱ��Ʋ�̫��ܣ�

һ��ԣ��Ӧ��ͬһʱ�̿��ͬ��

��ԣ��֤ÿ��յ�Ӧ��۳ɹ��ʧ��

��ݴ��ԣ��ϵͳ��Ϣ��ʧ��ʧ�ܲ�Ӱ��ϵͳϵͳ��

��ķ��LinkedIn��ʦ�Ŷ�ʵ��ǳ��Ϊʱ��һ��ԣ��˵��ϵͳ��һ��ԣ��ͣ��Լ��ԣ��Ժͷ��ݴ��ԡ��ĿǰLinkedIn��ݼܹ��

LinkedIn��ݼܹ�

��Ҫ֧��ڲ��һ��ڴ��û��ݼܹ��Ѿ��Բ��ˡ��ˣ�LinkedIn ��ʦ�Ŷ��ʽ��three-phase��ݼܹ��ߡ��Լ��ϵͳ��ɡ��Ͻ��LinkedIn��ݱ��洢��¼��ֲ�ͬ�� ʽ��ϵͳ�У��ͼ��

RDBMS
- Oracle
- MySQL��ΪEspresso�ĵײ��ݴ洢��
RDBMS
- Espresso��LinkedIn�Լ��ĵ��NoSQL��ݴ洢ϵͳ��
- Voldemart ��ֲ�ʽKey-value�洢ϵͳ��
- HDFS ��Hadoop map-reduce��ݣ�
Caching
- Memcached
��Lucene��
- ��Ų�ѯ��ϵͼ�ȹ��ݵ�Lucene ��
- Espressoʹ�õ��

ͼ��LinkedIn��ݿ�ϵͳ��DataBus��NoSQL��RDBMS�Լ�Indexes

��ᵽ��ݴ洢�ⱻ��Ϊ��ֲ�ͬ��͵�ϵͳ��һ��ͣ�

��ݿ�ϵͳ

��ϵͳ��û��ʵʱ��ݿ��Oracle��һ��ݴ洢��֧��û��д��Ķ��OrcaleΪ ��Oracle master��ִ��е�д��LinkedIn��ڿ��һ��Espresso��ϵͳ��渴�ӵ��󣬶��Щ��ݿ��Ʋ� Ӧ��Oracle��RDBMS�л�ȡ��ܷ��̭��л�󲿷ֵ�Oracle��ȫת�Ƶ��Espresso��NoSQL��ݴ洢ϵͳ ��ȥ��Ŀ�Դ��

Espresso��һ��֧��ˮƽ��չ��ʱ��һ��ԡ��ĵ��Ҹ߿��õ�NoSQL��ݲֿ⣬ּ�ڴ��֧�Ź�˾��ҳ��ʹ�õĴ�ͳOracle��ݿ⡣��ĳ��Ϊ��LinkedIn��InMail��Ϣ��Ŀ��ԡ�Ŀǰ��һЩӦ��ʹ��Espresso��Ϊ��Դϵͳ��ܹ��NoSQL��ݴ洢��ڶ�Ӧ�õ��棡

��Ա��Ϣ,
�罻��磺��
��·��
�û��
��˾��
��
��ݿ�ϵͳ

��ϵͳ��Ҫ��Hadoop��һ��Teradata��ݲֿ⣬��ִ��ͷ��Ĺ��֮��Ա��Ϊ��Ϊ��ִ�еĵ�� Apache Azkaban��Hadoop��ETL��Щ��Դϵͳ��ȡ��ݺ��map-reduce��HDFS��Ȼ��֪ͨ��ߡ��磺Voldemart��ͨ��ʵķ�ʽ��ȡ��Щ��ݲ��л��֤�ܻ�ȡ��µ��ݡ�

��ݿ�ϵͳ��ʱ��һ��ԣ�

��ϵͳ��Ŀ��Ϊ��ʵ��ʱ��һ��ԣ��һ��ԣ��ơ��ʶ��ˣ�ֻ��ݼ��Լ��罻ͼ��Щ��ܣ��Щ��ܵ��ݻ��£��Ƕ��ӳ��Ե�Ҫ�󲢲��ϵͳ��ߡ��Ǽ��ֲ�ͬ��͵Ľ��ϵͳ��

Voldemart��һ��Key-Value�洢ϵͳ��Ϊϵͳ�е�ֻ��ҳ��ṩ��Voldemart��Դ��Hadoop�� Hadoop Azkaban��Hadoop map-reduce��ִ�мƻ��ǽ��ϵͳ��Ǵ��Hadoop��ϵͳ��ȡ��ݡ��Щҳ��ݶ��Vold emart��
- ��ʶ��
- ��ҳ��˻��ڿ�
- ��
- ��ܸ��Ȥ�Ĺ��
- ��ܸ��Ȥ��¼�
��Ǽ��ֲ�ͬ��Щ��Databus-һ��仯��ݲ�׽ϵͳ-��µģ�
- ��SeaS��Search-as-a-Service��ʹ�õġ��Ա��LinkedIn��ͬ�ĳ�Աʱ��Щ��ݾ��ͨ��ܶ��Ƹ��Ա�İ��ܴ�
- �罻ͼ��ǵ��ϵ��ʾ��Ա�Լ��ϵ��ͨ��û��ʵʱ�ĵõ��ϵ�ı仯��
- ͨ��Ƽ��ȡ��ĳ�Ա��ݡ��Щ��ݻᱻ��׼��񡮷��ʡ��Ƽ��Ƕ�Դ��ݿ�ĸ��ƣ��ʹԴ��ݿ�ĸ��ͬ��Щ��Ƽ��档��Ӷ��Ƽ��Ҫԭ��ܹ�ͨ��ٲ�ѯ��ɢ��Ƽ��Դ��ݿ⣨ִ��û��д��ѹ��

��ͼչʾ��ݱ仯��¼��Databus��µ��ϵͳ�ģ�

��չʾ��ι��

��е��¼��ܺ�ְλ��㻹��һ��ô��ϵͳ�ڲ��׷��ʲô��

��д��Oracle Master��ݿ�
Ȼ��Databus��һϵ��Ĺ��ʵ��ʱ��һ��ԣ�
��ϱ��¼��ܺ�ְλ��Ϣ��µ��׼��
��ᵽ�ı��µ��
��ϵ��µ�ͼ��

��ݼܹ��

��Ҫ��һ��LinkedIn.comһ��֧��һ��ԡ��չ��Ҹ߿��Ե��ݼܹ��Խ��ľ��飺

��ݿ��д����Ӧ��ƻ��ݿ⣬һ��ִ��д��Ŀ��Գ�Ϊ��Դ��ϵͳ��һ��ִ�ж��Ŀ��Գ�Ϊ��ݿ�ϵͳ��ľ��鷨��ǽ��û��д��û��ʹ�õ��ݿ��ֿ��
��ݿ�ϵͳ��û��Ķ��Ӧ�ñ��䵽��ݿ��߶��Ƽ��ȥ��ݿ�ϵͳ��Խ��ϵͳ֮�ϣ�
```
- Lucene ����
```
- NoSQL��ݴ洢��磺Voldemart��Redis��Cassandra��MongoDB�ȡ�
��û��Ķ��Ӧ�þ��Դ��ݿ�ϵͳ��߻��key-value��ݣ��Դ��Hadoop map-reduce֮��ϵͳ��ҽ�ÿ��û��ı�д��Դϵͳ�ı��һ��µ��Щ��ݣ�key-value��
Ϊȷ��ݿ�ϵͳ��µģ��ѡ��Ӧ�ø�д��application-dual writes��Ӧ�ò�ͬʱд��ݿ��ݿ�ϵͳ��־�ھ򣨶�ȡͨ��õ��ݴ洢ϵͳ��ύ��־��
��ʱ��ݼ��߱��ݼ�ִ�л��Hadoop��map-reduce��Ȼ��HDFS��֪ͨ��ݴ洢ϵͳ��Voldemart��NoSQL�洢��ȡ��ݡ�

U��һ��˵��Խ��Щ��ݴ洢�ⴴ��Ϊ�ֲ�ʽϵͳ��Ⱥ�е�ÿ��ڵ��ֶ��ӽڵ㡣��нڵ㶼��Դ��ˮƽ��չ��Shards��

Ϊ�˱�֤��Щ�ֲ�ʽ��ݴ洢ϵͳ��ʱ��󻯣��ʹ��Apache Helix��һ��ļ�Ⱥ��ߡ�

�� LinkedIn ��ݴ��ѧϰ��ݼܹ�

��

��

��ؿγ�

��ص��

��ʵ�鳡��

�� LinkedIn �����ݴ�������ѧϰ���ݼܹ�

��������

��������

��ؿγ�

��ص�����

���ʵ�鳡��

�� LinkedIn ��ݴ��ѧϰ��ݼܹ�

��

��

��ص��

��ʵ�鳡��