2013. 10. 24. 14:46ㆍCloud/VM image Distribution
이 논문은 dedup기반으로 VM Image전송 알고리즘을 제안하고 평가하였다. 전형적 이미지 라이브러리가 시간에 따라 어떻게 update하는 것을 보여주며 이러한 변화가 논문에서 제안된 알고리즘에게 어떤 이득을 가져다 줄수 있다는 것을 탐구하였다.
Cluster Representation
클러스터는 블록의 해쉬값으로 표시된 이미지내에서의 부분 집합을 나타내는 meta-data이다. 클러스터는 이미지로부터 실제 데이터를 저장하거나 복사하지 않는다. Cluster는 블록 들의 sha1 hash와 block numbers references를 포함하는 Cluster_File를 사용하여 변경된 부분을 기록한다. 이미지가 추가될 때 클러스터명은 좌측에 비트로 확장된다. 이미지가 제거될 때 더 높은 이미지 인덱스는 우측으로 이동된다.
Image-9 is 238MB+ 419MB+ 187MB+260MB+ 444MB= 1548MB.
Key Algorithms
Cluster를 위한 주요 알고리즘은 clusterize_image와 declusterize_image으로 cluster list를 갱신하는 것이다. clusterize_image는 클러스터 메타 정보에 새로운 이미지를 증가할때 사용되며 declusterize_image는 이미지를 라이브러리에서 제거하고 cluster를 결합할때 사용된다. 또한 unique한 cluster로만 된 이미지를 삭제할때 사용된다. clusterize_image는 현재 존재하는 이미지를 분리하며 추가된 이미지를 포함하기 위해 새로운 블록을 추가하여 새로운 cluster를 만든다.
IBM Research Compute Cloud 2년간 만들어진 이미지 수는 11,801개 였으며 이들의 변화과정을 연구하였다. 이미지 라이브러리는 2 가지 이유로 시간이 지나면서 변화된다.
1) changes to public (catalog) images -고려하지 않는다
2) changes to private (user created) images
우리는 C++와 Java로 알고리즘을 구현하고 2개의 data center 에서 광범위한 테스트를 진행하며 2000개 이상의 이미지의 전송과 재구성을 수행했다.
VMWare Marketplace
Free open source software stacks 등77 image
IBM SmartCloud Enterprise
IBM Rational tools, Information Management tools, Websphere App Server 등90 image
그 결과 IBM 라이브러리에는 13% unique 한 블록이 있으며 VMWare 라이브러리에는 25% unique한 블록이 있다. 그러므로 optimization을 위한 중요한 기회를 주었다.
'Cloud > VM image Distribution' 카테고리의 다른 글
Efficiently Synchronizing Virtual Machines in Cloud Computing Environments (0) | 2013.11.19 |
---|---|
Improving the efficiency of deploying virtual machines in a cloud environment (0) | 2013.11.06 |
Orchestra (0) | 2013.10.24 |
VMTorrent (0) | 2013.10.24 |
분할 VM이미지에 대한 두가지 전형적인 P2P 모델 (0) | 2013.10.24 |