Tại sao không phải Server nào cũng có 4-Socket ?

Khi nhắc về các hệ thống máy chủ Server thì chắc chắn ai cũng nghĩ đến độ “khủng” về cả mặt kích thước và phần cứng. Đa số các hệ thống máy chủ Server chúng ta thường gặp là các hệ thống sử dụng 01 hoặc 02 Socket (ổ cắm). Tuy nhiên, vẫn có các hệ thống máy chủ Server sử dụng 4 Socket (ổ cắm), vậy tại sao Server 4-Socket lại không phổ biến như các Server sử dụng 01 hoặc 02 Socket? Trong bài viết này chúng ta sẽ cùng tìm hiểu về ưu điểm và nhược điểm của hệ thống máy chủ Server 4-Socket theo nhiều phương diện khác nhau nhé!

1: Điểm mạnh của Server 4-Socket

Tăng hiệu năng cho các nút node

Điểm mạnh lớn nhất của hệ thống Server 4-Socket đó chính là tăng hiệu năng cho các nút (Node). Điều này có nghĩa là trong cùng một Node chúng ta có dung lượng RAM và số lượng nhân CPU nhiều hơn. Việc tăng dung lượng RAM và số lượng nhân trong một Node sẽ giúp cho các hệ thống có thể mở rộng được quy mô mà không cần lắp thêm các node và network fabrics (cấu trúc mạng). Đối với các hệ thống máy chủ ảo hóa thì cấu hình phần cứng của các Node rất quan trọng, nó sẽ giúp họ tăng mật độ ảo hóa và hạn chế việc bị “nghẽn” tài nguyên.

Giải thích: Node (nút) là một máy tính con trong một hệ thống lớn.

Supermicro 2049P TN8R Internal CPU Area Memory

Tăng số lượng Lane PCIe

Một điểm lợi thế nữa chúng ta có thể dễ dàng nhận thấy đó chính là các  máy chủ Server 4-Socket có nhiều lane PCIe hơn. Trong hệ thống máy chủ, các lane PCIe được cung cấp bởi các CPU nên việc lắp được 4 CPU sẽ giúp số lane PCIe tăng gấp đôi so với các hệ thống sử dụng 2 CPU và tăng gấp bốn lần so với các hệ thống sử dụng 1 CPU. Cụ thể, trong hệ thống Server Intel Xeon hiện nay các bạn có thể tăng gấp đôi số lượng lane PCIe bằng cách nhân đôi các lane CPU. Đối với hệ thống máy chủ lưu trữ thì số lượng lane PCIe rất quan trọng, nó sẽ giúp cho hệ thống có thể kết nối được nhiều ổ cứng SAS/NVMe hơn và từ đó sẽ tăng dung lượng lưu trữ. Còn đối với các hệ thống máy chủ GPU thì các lane PCIe cũng có phần quan trọng không kém, nó sẽ giúp cho các hệ thống lắp được nhiều GPU hơn và các GPU có thể hoạt động ở mức băng thông tối đa với hiệu năng cao nhất có thể.

Inspur 4 Socket Olympus With GPU Box 32 GPU Topology At OCP Summit 2019

Tiết kiệm chi phí cơ sở hạ tầng

Bài toán kinh tế luôn là bài toán quan trọng đối với các nhà đầu tư, các máy chủ Server 4-Socket có khả năng tiết kiệm chi phí rất tốt. Tuy nhiên, việc tiết kiệm chi phí ở đây không phải là tiết kiệm chi phí đầu tư ban đầu mà là tiết kiệm chi phí cơ sở hạ tầng. Ví dụ: Trong mỗi node đều có rất nhiều phần chi phí cơ sở hạ tầng khác nhau, khi chúng ta gộp hai Node nhỏ (2-socket) lại với nhau thành một Node lớn (4-socket) thì chúng ta sẽ giảm được một nửa số lượng các Node trong hệ thống. Khi số lượng các node trọng hệ thống giảm thì phần chi phí cơ sở hạ tầng cũng sẽ được cắt giảm theo, một số khoản chi phí trong mỗi Node chúng ta có thể kể đến như: chi phí phần mềm quản lý, cổng quản lý switch…

Tiết kiệm chi phí phần cứng

Tiết kiệm chi phí không chỉ dừng lại ở việc tiết kiệm chi phí cơ sở hạ tầng mà chúng còn tiết kiệm cả chi phí phần cứng. Trong thực tế, nhiều máy chủ có thể sử dụng một NIC duy nhất cho mỗi Node. Trong trường hợp này, về cơ bản có nghĩa là tăng gấp đôi số lượng của Node là giảm một nửa số lượng NIC. Việc giảm được một nửa số lượng NIC sẽ đồng nghĩa với việc chúng ta tiết kiệm được chi phí: chi phí NIC, chi phí switch và optic/cable (dây mạng).

Giải thích: NIC là Card giao tiếp mạng (Network Interface Card)

Inspur TS860M5 4U8S 4S Board With OCP NIC

Tiết kiệm chi phí nguồn, giá đỡ và ổ đĩa khởi động…

Bên cạnh đó, khi sử dụng hệ thống máy chủ 4-socket thì chi phí khung đỡ và nguồn cung cấp năng lượng cũng được tối ưu hơn. Đối với mỗi Node trên mỗi hệ thống giá đỡ, chi phí của giá đỡ và hai nguồn được chia cho hai lần số lượng ổ cắm CPU và bộ nhớ, khi đó chi phí hiệu quả sẽ tăng. Trên hệ thống server 4-Socket, người ta cũng chỉ cần một ổ đĩa hoặc bộ ổ đĩa là có thể khởi động được và các bo mạch chủ 4-Socket người ta sẽ sử dụng một nửa số BMC, PCH và NIC so với các hệ thống Server Dual-Socket (2-Socket).

Inspur Systems NF8260M5 Hot Swap Fan

Cách đơn giản nhất để hiểu về toàn bộ khoản chi phí này đó chính là các bạn sẽ tiết kiệm được chi phí cho mỗi node chứ không phải tiết kiệm chi phí cho mỗi socket hay mỗi nhân. Kết quả là khi sử dụng các node lớn 4-socket chúng ta có thể tiết kiệm chi phí tối đa lên đến 50% chi phí cho từng hạng mục.

Sử dụng tối đa hiệu suất của nguồn

Khi các node 4-Socket hoạt động chúng sẽ cần nhiều năng lượng hơn vì chúng có nhiều linh kiện hơn (số lượng CPU nhiều hơn), điều này có nghĩa là các bộ nguồn cung cấp năng lượng cho hệ thống sẽ chạy ở mức giới hạn cao nhất trong phạm vi hoạt động của chúng. Nó sẽ mang lại hiệu quả cung cấp năng lượng tốt hơn và góp phần làm giảm TCO.

Supermicro SYS 2049U TR4 Four Xeon Platinum And 48x 32GB DDR4 DIMMs

Tối ưu hóa chi phí nâng cấp

Bên cạnh những ưu điểm đã liệt kê bên trên thì hệ thống Server 4-Socket còn có một ưu điểm khác đó chính là khả năng nâng cấp. Một số nhà cung cấp dịch vụ lớn trên thế giới họ có chiến lược triển khai các hệ thống Server 4-Socket như sau: Ban đầu họ sẽ chỉ sử dụng 02 CPU cho 2 Socket trên tổng số 4 Socket khả dụng, sau khi chúng đến giữa vòng đời thì họ tiếp tục lắp thêm 02 CPU tiếp theo vào 2 Socket còn lại để nâng tổng số CPU trong Server đó lên 04 CPU. Khi sử dụng chiến lược đó, họ sẽ không phải mua thêm máy chủ Server, họ chỉ việc mua thêm 02 CPU là hoàn thành xong công việc nâng cấp hệ thống. Như vậy, chi phí nâng cấp của họ trong tương lai sẽ rất “nhẹ”.

2. Nhược điểm hệ thống Server 4-Socket 

Chi phí đầu tư và vận hành

Khi triển khai đầu tư các node lớn 4-socket thì chi phí đầu tư sẽ lớn hơn, mặc dù chúng tiết kiệm được nhiều khoản chi phí khác nhau nhưng những khoản tiết kiệm đó vẫn còn quá nhỏ so với số tiền đầu tư. Với việc triển khai các node nhỏ họ sẽ cần số lượng Rack nhỏ hơn hoặc ít hơn và nhiều công ty họ muốn có nhiều node để cho các vùng lỗi (failure domains) nhỏ hơn. Với số tiền đầu tư vào các node thấp, khi một node gặp vấn đề nào đó khiến chúng bị ngoại tuyến (offline) thì chi phí hao tổn cũng sẽ thấp hơn nhiều so với chi phí hao tổn của một node lớn gặp sự cố.

Phụ thuộc vào các phần mềm

Trong thực tế, các phần mềm hiện đại ngày nay đang có xu thế tối ưu hóa hiệu năng cho từng nhân thay vì cho mỗi ổ cắm (socket) hay mỗi Node. Vì vậy, có nhiều socket hay là một Node mạnh cũng chưa chắc giải quyết được vấn đề cần thiết của phần mềm. Trong các doanh nghiệp, chi phí phần mềm thường lớn hơn so với chi phí phần cứng nên việc đạt được hiệu suất cao hơn trên mỗi nhân sẽ quan trọng hơn việc thúc đẩy tăng hiệu suất trong một Node.

Dell PowerEdge R930 Front in Rack

Hiệu suất hoạt động

Khi nói về hiệu suất, một trong những ảnh hướng lớn nhất đó chính là băng thông liên kết UPI. Ví dụ: Các CPU Intel Xeon Scalable Gold 6200 và Platinum 8200 đều có 3 liên kết UPI cho mỗi CPU. Trong các hệ thống máy chủ Server Dual-Socket (2-socket), các nhà sản xuất máy chủ sẽ sử dụng 2 hoặc 3 liên kết UPI để kết nối các CPU. Thông thường, trong các hệ thống máy chủ có giá thành thấp thì họ sẽ sử dụng 2 liên kết UPI trong tổng số 3 liên kết UPI khả dụng để tiết kiệm chi phí sản xuất bo mạch chủ và tiết kiệm năng lượng. Còn các máy chủ có hiệu suất cao (thường là Server Cloud) thì các nhà sản xuất sẽ sử dụng cả 3 liên kết UPI để tăng thêm khoảng 50% băng thông.

Đối với các máy chủ Server 4-socket thì chúng ta chỉ có duy nhất 1 liên kết UPI giữa các CPU. Chính vì chỉ có 1 liên kết UPI nên hiệu suất băng thông giữa các CPU bị giảm đáng kể. STH (Servethehome) đã thử nghiệm, họ sử dụng Xeon Gold 6200/ Platinum 8200 có 3 liên kết UPI (3x) để kiểm tra băng thông giữa CPU-CPU trong Server 4-socket. Khi các CPU sử dụng 1 liên kết UPI để giao tiếp với nhau thì băng thông giữa CPU-CPU có hiệu năng thấp, nó chỉ đạt khoảng 33%-50% hiệu năng nếu đem so sánh với máy chủ Server Dual-Socket (2-socket).

Intel Xeon Scalable 2 4 And 8 Socket Topology

Đối với dòng CPU Intel Xeon Gold 5200, mỗi CPU chỉ có 2 liên kết UPI. Điều này đồng nghĩa với việc trong hệ thống 4P (4 CPU) mỗi CPU chỉ có thể giao tiếp được với 2 trong 3 CPU khác trên hệ thống. Nếu bạn có rất ít dữ liệu truyền qua các CPU thì không sao, điều này hoàn toàn ổn. Đối với nhiều ứng dụng, cấu trúc liên kết 4-Socket có thể làm cho chúng thực hiện hai bước nhảy thay vì một, đây là một điều hết sức tồi tệ.

Trước đây, Nvidia cũng gặp tình trạng tương tự này đối với sản phẩm Tesla P100 SXM2 NVLink. Dòng sản phẩm Tesla V100 SXM2 NVLink sau này đã được nâng cấp với nhiều liên kết hơn giúp chúng có băng thông giao tiếp cao hơn.

Không phải CPU nào cũng hỗ trợ hệ thống 4P (4-CPU)

Quay lại câu chuyện, chúng ta sẽ nói về Xeon Platinum 9200, Xeon Bronze và Xeon Silver. Đối với Xeon Platinum 9200 thì chúng không thể hoạt động được trên hệ thống Server 4-Socket vì chúng bị giới hạn ở cấu hình 2 CPU do thiết kế. Nói thêm về Xeon Platinum 9200, Platinum 9200 có thiết kế 2 die silicon trên CPU nên khi hoạt động ở cấu hình 2 CPU thì nó sẽ có tốc độ băng thông CPU-CPU tương tự như cấu hình 4 CPU (Server 4-socket). Các dòng Intel Xeon Bronze và Silver không hỗ trợ kết nối cấu hình 4 CPU, chính vì điều đó mà các Server 4-Socket còn khá nhiều hạn chế về tương thích với các CPU.

Độ phức tạp trong sản xuất PCB

Bên cạnh đó, việc sản xuất các bo mạch chủ (PCB) cho hệ thống Server 4-Socket cũng đòi hỏi độ phức tạp cao hơn. Chính vì điều đó mà chúng ta chỉ thấy được vài hãng sản xuất cung cấp các bo mạch chủ 4-Socket. Đây là rào cản lớn khiến cho các hãng không “mạnh tay” đầu tư vào mảng Server 4-Socket.

Thời gian khởi động hệ thống Server

Việc khởi động lại hệ thống máy chủ Server 4-Socket tốn rất nhiều thời gian và tốc độ khởi động của chúng cũng rất chậm, nó thường mất vài phút để có thể POST và khởi động. STH (ServeTheHome) đã sử dụng một máy chủ có vài Terabyte DCPMM và chúng mất hơn 15 phút để POST. Đây thực sự là một lý do lớn khiến STH không sử dụng máy chủ 4P (4-CPU) trong cơ sở hạ tầng lưu trữ của họ vì chúng mất quá nhiều thời gian để trực tuyến.

Tác động từ AMD

Cũng có một luồng ý kiến cho rằng, các Server 4-Socket cũng chịu ảnh hưởng từ AMD vì họ cũng có nhiều Server Dual-Socket “khủng”. Cụ thể như sau: Với Server Dual-Socket sử dụng AMD EPYC 7002, hệ thống sẽ có 128 nhân. Trong khi đó Server 4-Socket của Intel (sử dụng Xeon Scalable Gen2) tối đa chỉ có 112 nhân. Khi nhìn vào kết quả này, các nhà đầu tư cần hệ thống có số lượng nhân nhiều họ sẽ chọn AMD vì chúng sẽ có hiệu quả kinh tế hơn, ít phức tạp hơn và thậm chí là số lượng nhân còn nhiều hơn.

3. Kết luận

Có rất nhiều ứng dụng mà người ta muốn sử dụng hệ thống Server 4-Socket. Ví dụ: rất nhiều khối lượng công việc thông minh và phân tích kinh doanh như SAP HANA, hệ thống Server 4 Socket sẽ cung cấp số lượng nhân nhiều và dung lượng RAM lớn để giải quyết vấn đề đó.

Nếu như các bạn không có nhu cầu như vậy, bạn vẫn có thể tiết kiệm được nhiều chi phí bằng cách chuyển sang cơ sở hạ tầng 4-Socket (bao gồm cả chi phí mua ban đầu và một số chi phí vận hành khác). Ngoài ra, các bạn sẽ có được thêm các tính năng như: số lượng lane PCIe nhiều hơn trên mỗi node.

“Rào cản” lớn nhất để Server 4-Socket (4P) trở lên phổ biến đó chính là giao tiếp UPI/ liên kết nút NUMA không mạnh bằng cấu hình ổ cắm kép 2P (Dual-Socket). Chính những điều đó đã làm cho những Server 4-Socket khó mở rộng thị trường và phát triển.