Documente Academic
Documente Profesional
Documente Cultură
1. Amazon S3 là gì ?
Dịch vụ lưu trữ đơn giản của Amazon là lưu trữ cho Internet. Nó được thiết kế để làm cho
tính toán quy mô web dễ dàng hơn cho các nhà phát triển.
Amazon S3 có giao diện dịch vụ web đơn giản mà bạn có thể sử dụng để lưu trữ và truy
xuất bất kỳ lượng dữ liệu nào, bất cứ lúc nào, từ bất kỳ đâu trên web. Nó cho phép bất kỳ
nhà phát triển nào truy cập vào cùng một cơ sở hạ tầng lưu trữ dữ liệu có khả năng mở rộng
cao, đáng tin cậy, nhanh chóng, rẻ tiền mà Amazon sử dụng để điều hành mạng lưới các
trang web toàn cầu của riêng mình. Dịch vụ này nhằm mục đích tối đa hóa lợi ích của quy
mô và chuyển những lợi ích đó cho các nhà phát triển.
Amazon S3 có nhiều tính năng mà bạn có thể sử dụng để tổ chức và quản lý dữ liệu nhằm hỗ
trợ các trường hợp sử dụng cụ thể, đạt hiệu quả về chi phí, thực thi bảo mật và đáp ứng các
yêu cầu về tuân thủ. Dữ liệu được lưu trữ dưới dạng đối tượng trong tài nguyên gọi là “bộ
chứa” và một đối tượng có thể có kích thước tối đa là 5 terabyte. Các tính năng của S3 bao
gồm khả năng bổ sung thẻ siêu dữ liệu cho đối tượng, di chuyển và lưu trữ dữ liệu trên Các
lớp lưu trữ S3, cấu hình và thực thi kiểm soát truy cập dữ liệu, ngăn không cho người dùng
trái phép truy cập dữ liệu, chạy phân tích dữ liệu lớn và giám sát dữ liệu ở cấp độ đối tượng
và bộ chứa.
Với tên bộ chứa S3, tiền tố, thẻ đối tượng và Kho S3, bạn có nhiều cách để phân loại và báo
cáo về dữ liệu của mình, từ đó có thể cấu hình các tính năng S3 khác để thực hiện tác vụ. S3
Batch Operations giúp bạn dễ dàng quản lý dữ liệu trong Amazon S3 ở mọi quy mô, cho dù
bạn lưu trữ hàng nghìn hay một tỷ đối tượng. Với S3 Batch Operations, bạn có thể sao chép
đối tượng giữa các bộ chứa, thay thế tập thẻ, sửa đổi kiểm soát truy cập và khôi phục đối
tượng được lưu trữ từ Amazon S3 Glacier, với một yêu cầu API S3 hoặc vài cú nhấp chuột
trong Bảng điều khiển quản lý Amazon S3. Bạn cũng có thể sử dụng S3 Batch Operations để
chạy hàm AWS Lambda trên các đối tượng của mình để thực thi logic kinh doanh tùy chỉnh,
chẳng hạn như xử lý dữ liệu hoặc chuyển mã tệp hình ảnh. Để bắt đầu, hãy chỉ định một danh
sách đối tượng mục tiêu bằng cách sử dụng báo cáo Kho S3 hoặc cung cấp danh sách tùy
chỉnh, sau đó chọn thao tác mong muốn từ menu điền sẵn.
Amazon S3 cũng hỗ trợ các tính năng giúp duy trì kiểm soát phiên bản dữ liệu, ngăn việc xóa
ngẫu nhiên và sao chép dữ liệu trong các Khu vực AWS khác. Với S3 Versioning, bạn có thể
dễ dàng duy trì, truy xuất và khôi phục mọi phiên bản của một đối tượng được lưu trữ trong
Amazon S3, điều này cho phép bạn khôi phục từ các hoạt động vô tình của người dùng và sự
cố ứng dụng. Để ngăn việc xóa vô tình, hãy bật Xóa bằng Multi-Factor Authentication
(MFA) trên một bộ chứa S3. Nếu bạn tìm cách xóa một đối tượng được lưu trữ trong bộ chứa
hỗ trợ Xóa bằng MFA, việc này yêu cầu hai hình thức xác thực: thông tin đăng nhập tài
khoản AWS của bạn và chuỗi chữ số sê-ri hợp lệ, khoảng trắng và mã 6 chữ số hiển thị trên
thiết bị xác thực được phê duyệt, chẳng hạn như chuỗi khóa phần cứng hoặc khóa bảo mật
Universal 2nd Factor (U2F). Với Sao chép liên khu vực S3 (CRR), bạn có thể sao chép đối
tượng (cùng với siêu dữ liệu và thẻ đối tượng tương ứng của đối tượng) vào Khu vực AWS
khác để giảm độ trễ, đảm bảo tính tuân thủ, bảo mật, khôi phục sau thảm họa và phục vụ các
trường hợp sử dụng khác. CRR S3 được cấu hình cho một bộ chứa S3 nguồn và sao chép đối
tượng vào một bộ chứa đích trong Khu vực AWS khác.
*Giám sát lưu trữ :
Bạn có thể áp dụng thẻ cho bộ chứa S3 để phân bổ chi phí ở nhiều mảng kinh doanh (chẳng
hạn như trung tâm chi phí, tên ứng dụng hoặc chủ sở hữu), sau đó sử dụng Báo cáo phân bổ
chi phí AWS để xem mức sử dụng và chi phí do các thẻ bộ chứa tổng hợp. Bạn cũng có thể
sử dụng Amazon CloudWatch để theo dõi tình trạng vận hành của các tài nguyên AWS và
cấu hình thông báo thanh toán được gửi cho bạn khi khoản phí ước tính đạt đến một ngưỡng
do người dùng xác định. Một dịch vụ giám sát AWS khác là AWS CloudTrail, theo dõi và
báo cáo các hoạt động ở cấp độ bộ chứa và đối tượng. Bạn có thể kích hoạt S3 Event
Notifications để kích hoạt quy trình công việc, thông báo và gọi AWS Lambda khi một thay
đổi cụ thể được thực hiện đối với tài nguyên S3 của bạn. Thông báo sự kiện S3 có thể được
sử dụng để tự động chuyển mã tệp phương tiện khi các tệp này được tải lên Amazon S3, xử
lý tệp phương tiện khi khả dụng hoặc đồng bộ hóa đối tượng với các kho dữ liệu khác.
S3 Standard cung cấp độ bền cao, tính sẵn có và lưu trữ đối tượng hiệu suất cho dữ liệu
thường xuyên truy cập.
Độ trễ thấp và hiệu suất thông lượng cao tương tự của Tiêu chuẩn S3
Phí giám sát và tự động hàng tháng nhỏ
Tự động di chuyển các đối tượng giữa hai tầng truy cập dựa trên việc thay đổi mẫu truy cập
Hỗ trợ SSL cho dữ liệu truyền và mã hóa dữ liệu khi nghỉ ngơi
Giá cả :
S3 One Zone-IA dành cho dữ liệu được truy cập ít thường xuyên hơn, nhưng yêu cầu
truy cập nhanh khi cần. Không giống như các lớp lưu trữ S3 khác lưu trữ dữ liệu
trong tối thiểu ba vùng khả dụng (AZ), S3 One Zone-IA lưu trữ dữ liệu trong một AZ
duy nhất và có giá thấp hơn 20% so với S3 Standard-IA. S3 One Zone-IA lý tưởng
cho những khách hàng muốn có tùy chọn chi phí thấp hơn cho dữ liệu được truy cập
không thường xuyên nhưng không yêu cầu tính khả dụng và khả năng phục hồi của
S3 Standard hoặc S3 Standard-IA. Đó là một lựa chọn tốt để lưu trữ các bản sao dự
phòng thứ cấp của dữ liệu tại chỗ hoặc dữ liệu dễ dàng tạo lại. Bạn cũng có thể sử
dụng nó làm bộ lưu trữ hiệu quả chi phí cho dữ liệu được sao chép từ một Vùng AWS
khác bằng cách sử dụng Sao chép vùng chéo S3.
Vì S3 One Zone-IA lưu trữ dữ liệu trong Vùng khả dụng AWS duy nhất, dữ liệu được
lưu trữ trong lớp lưu trữ này sẽ bị mất trong trường hợp phá hủy Vùng sẵn có.
Giá cả :
S3 Glacier là lớp lưu trữ an toàn, bền và chi phí thấp để lưu trữ dữ liệu. Bạn có thể
lưu trữ đáng tin cậy bất kỳ lượng dữ liệu nào với chi phí cạnh tranh hoặc rẻ hơn so
với các giải pháp tại chỗ. Để giữ chi phí thấp nhưng phù hợp với các nhu cầu khác
nhau, S3 Glacier cung cấp ba tùy chọn truy xuất trong khoảng từ vài phút đến vài
giờ.
Thời gian truy xuất cấu hình, từ vài phút đến vài giờ
API PUT S3 để tải trực tiếp lên S3 Glacier và quản lý Vòng đời S3 để tự động
di chuyển các đối tượng
Giá cả :
Để bảo vệ dữ liệu của bạn trong Amazon S3, theo mặc định, người dùng chỉ có quyền truy cập vào tài
nguyên S3 mà họ tạo. Bạn có thể cấp quyền truy cập cho người dùng khác bằng cách sử dụng một hoặc kết
hợp các tính năng quản lý truy cập sau: AWS Identity and Access Management (IAM) để tạo người dùng
và quản lý quyền truy cập tương ứng của họ; Access Control Lists (ACL) để làm cho các đối tượng riêng
lẻ có thể truy cập được đối với người dùng được ủy quyền; chính sách xô để định cấu hình quyền cho tất
cả các đối tượng trong một nhóm S3; và Query String Authentication để cấp quyền truy cập giới hạn thời
gian cho người khác bằng các URL tạm thời. Amazon S3 cũng hỗ trợ Audit Logs(Nhật ký kiểm toán) liệt
kê các yêu cầu được thực hiện đối với tài nguyên S3 của bạn để hiển thị đầy đủ về người đang truy cập dữ
liệu nào.
Amazon S3 có tính năng tích hợp và các dịch vụ miễn phí truy vấn dữ liệu mà không cần sao
chép và tải nó vào một nền tảng phân tích hoặc kho dữ liệu riêng biệt. Điều này có nghĩa là
bạn có thể chạy các phân tích dữ liệu lớn trực tiếp trên dữ liệu của bạn được lưu trữ trong
Amazon S3. S3 Chọn là một tính năng S3 được thiết kế để tăng hiệu suất truy vấn lên tới
400% và giảm chi phí truy vấn tới 80%. Nó hoạt động bằng cách truy xuất một tập hợp con
dữ liệu của một đối tượng (sử dụng các biểu thức SQL đơn giản) thay vì toàn bộ đối tượng,
có thể có kích thước lên tới 5 terabyte.
Amazon S3 cũng tương thích với các dịch vụ phân tích AWS Amazon Athena và Amazon
Redshift Spectrum. Amazon Athena truy vấn dữ liệu của bạn trong Amazon S3 mà không
cần phải trích xuất và tải nó vào một dịch vụ hoặc nền tảng riêng biệt. Nó sử dụng các biểu
thức SQL tiêu chuẩn để phân tích dữ liệu của bạn, cung cấp kết quả trong vài giây và thường
được sử dụng để khám phá dữ liệu ad hoc. Amazon Redshift Spectrum cũng chạy các truy
vấn SQL trực tiếp đối với dữ liệu ở phần còn lại trong Amazon S3 và phù hợp hơn cho các
truy vấn phức tạp và các tập dữ liệu lớn (tối đa exabyte). Vì Amazon Athena và Amazon
Redshift chia sẻ một danh mục dữ liệu và định dạng dữ liệu chung, bạn có thể sử dụng cả hai
cùng một bộ dữ liệu trong Amazon S3.
Truyền dữ liệu
AWS có một bộ dịch vụ di chuyển dữ liệu giúp việc truyền dữ liệu vào AWS Cloud trở nên đơn giản,
nhanh chóng và an toàn. Tăng tốc truyền S3 được thiết kế để tối đa hóa tốc độ truyền tới các thùng S3
trong khoảng cách xa. Để truyền dữ liệu rất lớn, hãy cân nhắc sử dụng AWS Snowball , AWS Snowball
Edge và AWS Snowmobile để di chuyển petabyte đến exabyte dữ liệu lên AWS Cloud với chi phí chỉ
bằng 1/5 so với Internet tốc độ cao. Các dịch vụ AWS Snow này hoạt động bằng cách sử dụng các thiết bị
vật lý an toàn để vận chuyển dữ liệu qua đường và giải quyết các vấn đề di chuyển như chi phí mạng cao,
thời gian chuyển dài và bảo mật.
Khách hàng muốn giữ các ứng dụng tại chỗ của mình và kích hoạt kiến trúc lưu trữ đám mây có thể sử
dụng AWS Storage Gateway (dịch vụ lưu trữ đám mây lai) để kết nối liền mạch các môi trường tại chỗ với
Amazon S3. Bạn có thể tự động chuyển dữ liệu giữa lưu trữ tại chỗ và AWS (bao gồm cả Amazon S3)
bằng cách sử dụng AWS DataSync , có thể truyền dữ liệu với tốc độ nhanh hơn tới 10 lần so với các công
cụ nguồn mở. Nếu bạn muốn chuyển tệp trực tiếp vào và ra khỏi Amazon S3 bằng Giao thức truyền tệp an
toàn (SFTP), hãy sử dụng AWS Transfer cho SFTP - dịch vụ được quản lý hoàn toàn cho phép trao đổi
tệp an toàn với bên thứ ba.
Khách hàng cũng có thể làm việc với các nhà cung cấp bên thứ ba từ Mạng đối tác AWS (APN) để triển
khai các kiến trúc lưu trữ lai, tích hợp Amazon S3 vào các ứng dụng và quy trình công việc hiện có và
chuyển dữ liệu đến và từ AWS Cloud.
Step1 :
Trước tiên chúng ta đến với bảng điều khiển của AWS Managerment. Click chọn dịch vụ
S3 trong tab Services .
Step 2:
Tiếp theo ta bước đến giao diện của dịch vụ AWS S3 và chọn tạo Bucket ( Tạo xô )
Step 3:
Cấu hình Bucket của bạn theo 3 giai đoạn và ấn tiếp tục
Chú thích :
1 . Bucket name(tên xô) : Tên bucket mà bạn muốn tạo, viết liền không dấu, hoặc ngăn cách bởi
dấu gạch ngang “-” giữa các từ (ví dụ hocmangmaytinh hoặc hoc-mang-may-tinh)
2. Region(Khu vực): Khu vực mà bạn muốn đặt dữ liệu tới vị trí đó, tùy vào đối tượng mà các
web, ứng dụng bạn muốn hướng tới thì chọn nơi phù hợp, ví dụ: Người dùng, khách hàng của
bạn chủ yếu là ở Việt Nam thì bạn nên chọn Singapore thì tốc độ truy xuất dữ liệu về VN sẽ
nhanh hơn những Region khác, ngược lại ở nước ngoài truy cập sẽ chậm hơn.
3. Copy settings from an existing bucket: Tính năng này giúp bạn copy những thông số cài đặt
đã được cấu hình từ bucket trước cho bucket mới.
Chú thích :
Quản lý chính sách xô công khai cho bucket: quản lý các chính sách public xô cho các user
Quản lý dach sách ACL : điều khiển truy cập cho các đối tượng .
Step 6:
Xem lại các cài đặt và tạo xô :
Trang chính xô hiển thị bucket đã được tao:
Step 7:
Tiếp theo để sử dụng bucket của bạn . Chọn vào các xô bạn đã tạo và muốn sử dụng .Trong giao
diện xô cho phép nhiều thao tác như : tải các đối tượng trong xô , thêm thẻ ,thay đổi siêu dữ
liệu,…
Để up dữ liệu lên xô đầu tiên cần tạo folder để chứa các đối tượng tải lên và phân loại danh mục
Step 8:
Click vào thư mục đã tạo Chọn tải lên để up dữ liệu cần lưu trữ
Xem lại các cài đặt cho dữ liệu up lên và chọn tải lên
Dữ liệu đã được up lên