Thứ Tư, 26 tháng 2, 2014

NVIDIA Quadro vs AMD FirePro: Bất phân thắng bại


Một lần nữa, chúng ta có dịp quay trở lại với cuộc đua tranh giữa những thế hệ card đồ họa chuyên dụng. Trở lại mốc thời gian cách đây một vài năm, tôi đã từng có dịp giới thiệu về những chiếc card đồ họa chuyên dụng ATI FirePro của AMD và Quadro FX của NVIDIA qua 1 series bài viết đặc biệt trên CGExpress và vozExpress. Giờ là lúc chúng ta hãy cùng nhìn xem liệu những dòng GPU chuyên dụng Quadro FX dành cho đồ họa của NVIDIA với nền tảng kiến trúc Fermi có thực sự đánh bật được những đối thủ ATI FirePro đến từ AMD hay không? Và hiệu năng thực tiễn của chúng trong các tác vụ đồ họa chuyên nghiệp.

Cũng cần nhắc lại là cả 2 dòng (FirePro và Quadro FX) đều hướng tới các thị trường CAD/CAM và DCC cao cấp. Nói cách khác, những dòng GPU này hướng tới giới đồ họa chuyên nghiệp, những người không chỉ dựa vào tốc độ mà còn cần tới sự ổn định và hỗ trợ tốt.
--oO Phần 1: Giới thiệu và đặc tả Oo--

Card đồ họa chuyên dụng và phổ thông

Vậy đâu là sự khác biệt giữa một card tăng tốc đồ họa tầm trung (dành cho người dùng phổ thông) và đối thủ là card tăng tốc đồ họa chuyên dụng (dành cho các nhà đồ họa chuyên nghiệp)? Ở góc độ phần cứng, câu trả lời là “không có nhiều sự khác biệt” – dĩ nhiên không nhiều như cuối những năm 1990 và đầu những năm 2000, khi mà các công ty như 3Dlabs, Intergraph và ELSA đã nỗ lực xây dựng các phần cứng chuyên dụng hướng tới những người dùng chuyên nghiệp.

Những ngày ấy, hầu hết các card đồ họa chuyên nghiệp đều chia sẻ phần cứng với những mảng phổ thông của chúng, dù các chip thường được tự tay chọn lựa từ những phần có chất lượng cao nhất trong quy trình sản xuất. Bên cạnh đó, chúng còn được bổ sung nhiều RAM hơn các dòng card phổ thông tương ứng – những yếu tố thực sự rất quan trọng, như tôi sẽ đề cập đến ở phần sau của bài viết này.

Tuy vậy, sự khác biệt lớn nhất giữa các card đồ họa chuyên dụng và các card đồ họa phổ thông tương đương chính là các trình điều khiển (driver) và sự hỗ trợ phần mềm của chúng. Trong khi các phần cứng phổ thông thường được đẩy thên nhiều phép tính shader và nhiều xung fill rate, thì các card đồ họa chuyên nghiệp lại tập trung vào việc xử lý các tác vụ 3D như các phép biến đổi hình học và vertex matric, và nhờ dựa vào các hàm GPGPU API như CUDA, OpenCL và DirectCompute nên hiệu năng của chúng cũng cao hơn hẳn các card đồ họa phổ thông.
Các card chuyên nghiệp cũng được mở rộng tối ưu hóa, thử nghiệm và chứng thực để sử dụng với các ứng dụng CAD và DCC, cụ thể là trong trường hợp này những chiếc card chuyên dụng sẽ được test với các phần mềm đồ họa phổ biến như 3ds Max, Maya, Softimage, AutoCAD và SolidWorks.

Dòng card chuyên dụng này không chỉ tăng tốc hiệu năng mà còn cung cấp độ ổn định tuyệt vời hẳn và dễ dàng nhận ra khi so sánh với những đối thủ khác của nó trên các máy tính để bàn, đặc biệt là khi chạy các gói phần mềm CAD/CAM chuyên nghiệp. Khi tôi thăm dò những người dùng khác, thì nói chung mọi người đều đồng ý rằng khi các ứng dụng đó sẽ làm việc với các card tăng tốc đồ họa phổ thông thì hiệu năng của những chiếc card đồ họa không chuyên nghiệp này chỉ dừng ở mức trung bình thấp, và khung nhìn (viewport) đôi khi khá lóa và dị thường. Các vấn đề này sẽ xuất hiện ít hơn nhiều khi sử dụng các card đồ họa chuyên nghiệp, và một khi chúng được xác định thì sẽ được tìm ra nhanh chóng, bởi vì các nhà sản xuất đưa ra các hỗ trợ khách hàng thường xuyên hơn dành cho các sản phẩm chuyên nghiệp của họ.

Đội hình của năm nay

Bài review này sẽ bao gồm benchmark cho các dòng card đã review những năm trước đây (gồm ATI FirePro V3800, V4800, V5800, V7800, V8800 của AMD và Quadro FX 3800, FX 5800 của NVIDIA). Ngoài ra, tôi còn đưa vào các dòng card cao cấp tầm trung của NVIDIA hiện nay như Quadro 2000, 4000, 5000, và 6000, thêm đó là một card chuyên nghiệp tầm trung và caop cấp của AMD là FirePro V5900 và V7900.

Tất cả các thế hệ card hiện nay trong thử nghiệm này đều hỗ trợ hầu hết các phép tính đồ họa chuyên nghiệp trên máy trạm và các compute API, bao gồm Shader Model 5, OpenGL 4, DirectX 11, OpenCL 1. Ngoài ra, các card đồ họa Nvidia còn hỗ trợ tập lệnh API độc quyền có tên là CUDA. Các thế hệ card trước đó như FX 3800, FX 5800 và V8750 hỗ trợ Shader Model 4, OpenGL 3 và DirectX 10.

Vậy hãy cùng xem xét từng chiếc card đồ họa chuyên dụng này để kiểm chứng sức mạnh của chúng. Các chỉ số của những chiếc card từ những bài review năm trước vẫn được dùng lại để so sánh và đối chiếu, nhưng trong bài viết này tôi chỉ tập trung đi sâu vào chi tiết với những chiếc card đồ họa chuyên dụng mới.

Những dòng card cấp thấp.

Chỉ có 2 card đồ họa cấp thấp xuất hiện trong thử nghiệm lần này, đó là ATI FirePro V3800 và V4800, và cả 2 đều đã được đề cập trong bài review năm ngoái. NVIDIA có 2 sản phẩm cấp thấp mới là Quadro 400 và Quadro 600. Tuy nhiên, đây là những card chuyên dụng cấp thấp dành cho các giải pháp CAD/CAM hơn là DCC hay animation, do vậy tôi không đưa 2 dòng này vào bài review năm nay.

Các dòng card tầm trung.

NVIDIA: Chiếc card mới đầu tiên trong bài review này là Quadro 2000. Nó được trang bị tới 1GB bộ nhớ GDDR5 và sử dụng băng thông giao tiếp 128-bit nhằm cung cấp một băng thông bộ nhớ lên tới 41.6GB/s. GPU có mức xung là 625MHz và có tới 192 nhân CUDA dành cho điện toán GPU. Các cổng xuất gồm có 1 cổng dual-link DVI và 2 cổng DisplayPort. Công suất tiêu thụ của card này là 62W.

AMD: Chiếc card tầm trung mới đầu tiên của AMD mà tôi đề cập đến trong bài đánh giá này là FirePro V5900. Nó được trang bị bộ nhớ gấp đôi người tiền nhiệm của nó là V5800, thay vì chỉ dùng 1GB GDDR 5 như ở V5800 thì V5900 được trang bị tới 2GB bộ nhớ GDDR5 với chuẩn giao tiếp 256-bit và đẩy băng thông bộ nhớ lên tới 64GB/s. Xung nhịp GPU của nó là 600MHz và chứa tới 512 Stream processor dành cho điện toán GPU. Các cổng xuất gồm có một cổng dual-link DVI connector và cổng 2 DisplayPort connector. Mức tiêu thụ điện năng của card này là 75W.

Các card đồ họa tầm trung khác có trong bài review này là ATI FirePro V5800 và Nvidia Quadro FX 3800.

Các dòng card cao cấp.

NVIDIA: Chúng tôi có 2 chiếc card chuyên dụng cao cấp từ NVIDIA là Quadro 4000 và Quadro 5000. Trong đó, Quadro 4000 được trang bị 2GB bộ nhớ GDDR5 với giao tiếp bộ nhớ 256-bit và cung cấp băng thông bộ nhớ lên tới 89.6GB/s. Xung nhân GPU đạt mức 475MHz và chứa tới 256 nhân CUDA dành cho điện toán GPU. Các cổng xuất của card này bao gồm 1 cổng dual-link DVI connector và 2 cổng DisplayPort connector. Mức tiêu thụ điện năng của dòng này là 142W.
Trong khi Quadro 5000 được trang bị tới 2.5GB bộ nhớ GDDR5 với giao tiếp 320-bit nhằm cung cấp mức băng thông bộ nhớ lên tới 120GB/s. Xung GPU đạt mức 513MHz và được trang bị tới 352 nhân CUDA dành cho điện toán GPU. Phần xuất của card này bao gồm 1 cổng dual-link DVI connector và 2 cổng DisplayPort connector. Mức tiêu thụ điện năng của chiếc card này lên tới 152W.

AMD: Chiếc card mới thứ 2 của AMD là FirePro V7900. Chứa tới 2GB bộ nhớ GDDR5 và giao tiếp 256-bit nhằm cung cấp một băng thông bộ nhớ lên tới 160GB/s. Xung nhịp GPU được đẩy lên mức 725MHz và chứa tới 1280 Stream processor dành cho điện toán GPU. Các ngõ xuất bao gồm 4 cổng DisplayPort connector. Mức tiêu thụ điện năng của dòng này là 150W.
Các dòng card cao cấp cũ hơn ở tầm này là ATI FirePro V7800 và V8800 của AMD, và Quadro FX 5800của NVIDIA.

Các dòng card đồ họa siêu cao cấp

NVIDIA: Ở phân khúc đỉnh cao này, chúng tôi có được một chiếc Quadro 6000 của NVIDIA. Model này được trang bị tới 6GB bộ nhớ GDDR5 và sử dụng giao tiếp 384-bit để cung cấp một băng thông bộ nhớ lên tới 144GB/s. GPU có xung nhân 574MHz và được trang bị tới 448 nhân CUDA dành cho điện toán GPU. Các ngõ xuất bao gồm 1 cổng dual-link DVI connector và 2 cổng DisplayPort connector. Mức tiêu thụ điện năng của model này lên tới 204W.
AMD: Ở phân khúc này, AMD có dòng FirePro V9800. Tuy nhiên, trong đợt thử nghiệm này tôi không nhận được chiếc card này để benchmark, do vậy tôi không đề cập đến dòng này trong bài review này.
Để so sánh một cách khách quan giữa các chiếc card được đề cập tới trong bài review này, chúng tôi lấy mức giá từ trang Newegg.com

Một vài điều về công nghệ

Trước khi đề cập sâu hơn, chúng ta hãy cùng nhìn lại ý nghĩa của một vài đặc tả.

DisplayPort connector

DisplayPort nhanh chóng trở thành định dạng xuất được chọn dành cho các card đồ họa chuyên nghiệm – với một vài lý do đáng giá, bao gồm cả những đầu kết nối nhỏ hơn về mặt vật lý, including physically smaller connectors, bảo toàn tín hiệu tốt hơn và khả năng tiến xa hơn những độ phân giải hiện nay dành cho các màn hình có độ phân giải siêu nét trong tương lai. Tuy vậy, không phải màn hình nào cũng có các cổng kết nối chuẩn DisplayPort.
Đây cũng là nơi mà các bộ chuyển đổi DisplayPort sang DVI đòi hỏi phải có. Chúng hoạt động tốt nhưng bạn có thể phải cần thêm nhiều cổng hơn những gì mà các card phổ thông cung cấp – và trong khi DisplayPort là một trong những thiết bị adapter liên kết đơn tương đối rẻ tiền, thì vấn đề thực sự sẽ xảy ra khi bạn sở hữu những màn hình lên tới 30 inches và trong khi chỉ có một cổng dual-link DVI inputs.

Trong khi đó, để một cổng xuất DisplayPort truyền đi tín hiệu đạt được độ phân giải 2560 x 1600 tới một màn hình được trang bị cổng DVI, thì phải cần tới một thiết bị chuyển đổi DisplayPort sang dual-link DVI. Đây là các đơn vị nguồn (điện năng) được rút ra từ nguồn của máy tính (thiết bị chủ) thông qua một kết nối USB, vậy vấn đề không chỉ là chúng khá đắt so với các đầu các bộ chuyển đổi đơn (khoảng 100USD cho một đầu chuyển đổi dual-link DVI, và so với 10USD-25USD cho một đầu chuyển đổi /kích hoạt DVI đơn), hơn thế nữa chúng cũng còn đòi hỏi thêm một cổng USB trống cho mỗi một thiết bị chuyển đổi sử dụng.

Mặc dù đang có những sự bất tiện ấy, nhưng thời cơ của giao tiếp DisplayPort đã đến khi nó cho ta nắm bắt các tiến bộ của công nghệ như 30-bit màu và công nghệ Eyefinity của AMD – cho phép một card đồ họa đơn có thể chạy và cung cấp hình ảnh cho 3 đến 6 màn hình.

Thiết lập nhiều màn hình.

Chúng ta đã từng biến đến Eyefinity của AMD, nhưng tôi muốn nói lại ở đây là tôi cảm thấy đây là một tính năng quan trọng của các dòng sản phẩm FirePro, và ở góc độ nào đó thì NVIDIA nên xem xét để chạy đua. Các dòng FirePro V4800, V5800, V5900 và V7800 có thể chạy và xuất tới 3 màn hình 30-inch ở độ phân giải 2560 x 1600 thông qua một đầu kết nối dual-link DVI và hai cổng DisplayPort. Trong khi V7900 và V8800 có thể cung cấp hình ảnh cho đồng thời 4 màn hình 30-inch ở độ phân giải 2560 x 1600 với 4 cổng DisplayPort; và riêng V9800 có thể cung cấp hình ảnh ở độ phân giải 2560x1600 đồng thời cho 6 màn hình khác nhau thông qua 6 cổng Mini DisplayPort, tương đương với việc cung cấp một màn hình có độ phân giải lên tới 7680 x 3200 nếu sắp xếp theo kiểu thiết lập truyền thống.
Trong khi đó, để thiết lập nhiều màn hình một lúc như thế với các dòng card của NVIDIA, bạn phải cài đặt nhiều card trên cùng một máy tính trạm bởi vì các card Quadro chỉ hỗ trợ 2 màn hình cho mỗi card. Giải pháp sử dụng nhiều card này sẽ phải tăng thêm điện năng tiêu tốn cho hệ thống và cũng tăng thêm chi phí trang trải cho thiết bị.

Vậy những người dùng đồ họa DCC có thực sự cần tới nhiều màn hình như thế? Thực tế thì hiện giờ tôi đã và đang sử dụng cấu hình 3-4 màn hình cùng lúc, và tôi chỉ muốn nói với bạn rằng hãy thử dùng đi, một khi bạn đã dùng rồi thì bạn chẳng muốn quay lại 1 hay 2 màn hình như trước nữa đâu. Chẳng hạn, bạn mua một cặp màn hình 30-inch, một màn hình 22-inch cùng một bảng vẽ Wacom Cintiq. Bạn cắm tất cả chúng vào một chiếc card FirePro và ôi chao!!! Hãy xem bạn sẽ mở 3ds Max / Maya trên một màn hình 30-inch, chạy Photoshop trên một màn hình 30-inch còn lại, và chạy ZBrush hay Mudbox trên màn hình Cintiq, và cuối cùng bạn duyệt web hay xem hình ảnh tham khảo trên màn hình 22-inch còn lại! Hãy tưởng tượng xem!!! Không cần phải chạy phím tắt Alt+Tab để chuyển đổi giữa các màn hình làm việc nữa, và cũng chẳng bao giờ có chuyện bị gián đoạn cửa sổ khi hiển thị cửa sổ cùng 1 lúc trên 2 màn hình.

(Một lần nữa, tôi nhấn mạnh rằng các bạn vẫn có thể thiết lập đa màn hình như thế với phần cứng của NVIDIA, nhưng có thể bạn sẽ phải mua thêm card nếu dùng nhiều hơn 2 màn hình, bạn cũng phải có thêm khe cắm PCI Express x16, thêm cáp nguồn và nguồn của bạn cũng phải đủ mạnh để tải chúng)
Nếu tiền bạc cho phép, bạn thậm chí có thể chạy tới 4 card AMD FirePro V9800s trên một hệ thống đơn, và cung cấp hình ảnh cho khoảng… 24 màn hình 30-inch và Windows 7 sẽ hỗ trợ 24 màn hình! Có khả năng chạy nhiều màn hình và được nhìn thấy mọi thứ cùng một lúc quả là một trải nghiệm thú vị và hiệu quả với công việc, và nó hoàn hảo cho các máy workstation đa lõi hiện nay.

Điện toán GPGPU

Trước khi chuyển đến xem xét các kết quả benchmark, tôi cũng muốn dành thời gian một chút để nói về điện toán GPGPU. Đây là tiến trình mà các GPU của card đồ họa được sử dụng để hỗ trợ và giảm tải cho CPU của hệ thống trong việc thực thi các tác vụ điện toán chung. Tiềm năng của công nghệ này rất ấn tượng và thú vị, và chúng ta chỉ mới bắt đầu được xem các ứng dụng sử dụng nó.

Đấy là khi các card đồ họa chuyên nghiệp góp phần và chiếm thế thượng phong so với các đối thủ của chúng ở mảng card đồ họa phổ thông. Nên nhớ rằng, như tôi đã nói từ trước, các card chuyên dụng có nhiều RAM tích hợp sẵn trên bo mạch hơn, được trang bị nhiều RAM hơn cũng đồng nghĩa với việc chúng có khả năng thực thi nhiều phép tính hơn. Trừ phi nhiệm vụ của GPU là cố gắng thực thi lấp đầy toàn bộ bộ nhớ được trang bị trên card, còn lại dữ liệu phải được chuyển đổi giữa RAM trên GPU và RAM trên bản thân máy trạm khiến cho việc tính toán mất thời gian hơn do có độ trễ và hiện tượng nghẽn cổ chai khi băng thông thấp.
Chẳng hạn, trong một vùng đã crop mà GPU đang được sử dụng để thực hiện tăng tốc raytracer, toàn bộ các scene 3D phải phù hợp với bộ nhớ card trên đồ họa để card có thể sử dụng nhằm giúp quá trình render nhanh hơn. Nếu scene quá lớn, GPU sẽ bỏ qua quá trình render và khi đó chỉ CPU được sử dụng trong quá trình render, khiến thời gian render sẽ kéo dài và kém hiệu quả. Đó là lý do tại sao các card đồ họa chuyên dụng được trang bị từ 2-6GB bộ nhớ nhằm mở rộng ngân hàng bộ nhớ đặc biệt này.

Hiện nay có 2 API chính được sử dụng cho điện toán GPU, đó là CUDA và OpenCL. Trong khi OpenCL là một chuẩn mở và được hỗ trở bởi cả AMD và NVIDIA, thì NVIDIA đang bắt đầu một sự khởi đầu mới bằng CUDA – một công nghệ độc quyền của hãng.

NVIDIA là một trong những nhà sản xuất phần cứng đầu tiên thực sự thúc đẩy điện toán GPU và hoàn toàn đi theo mảng công nghệ từ năm 2006, khi hãng giới thiệu G80 – kiến trúc unified shader architecture (kiến trúc đổ bóng hợp nhất) đầu tiên – trên thế hệ card đồ họa 8800 GTX (xem thêm bài CUDA – Điện toán GPU trên tạp chí CGEZINE số X4 của chúng tôi). Điều này sớm dẫn đến việc mở rộng phạm vi của các ứng dụng hỗ trợ CUDA và khiến vị thế của OpenCL lung lay. Tuy nhiên, tôi cũng mong điều này sẽ khiến thay đổi theo chiều hướng tích cực, sẽ khiến OpenCL trưởng thành hơn, cũng như các nhà phát triển sẽ phát triển nhiều hơn cho một API chuẩn của nền công nghiệp hơn là chỉ chăm chăm phát triển nhiều API độc quyền.

Khi được đưa vào ứng dụng trong render, có một số ứng dụng có thể sử dụng GPU để tăng tốc quá trình render, tỉ lệ phân chia khá đồng đều giữa OpenCL và CUDA. Cá biệt trong số đó có một vài tên tuổi như iray của mental image, Arion của Random Control và Octane Render của Refractive Software lại tập trung vào khai thác và chỉ sử dụng CUDA cho quá trình render của chúng; trong khi đó thì các ứng dụng render như Indigo Renderer của Glare Technologies, V-Ray RT của Chaos Group và FurryBall Art And Animation Studio renderer lại dùng hoàn toàn bằng OpenCL. Tăng tốc GPU cũng đến với các ứng dụng mã nguồn mở như LuxRender và finalRender 4 của cebas trong tương lai gần, và chúng ta tin rằng cả hai cũng sẽ là những ứng dụng thực thi tốt OpenCL cũng như NVIDIA CUDA.

Hiện nay có sẵn một vài engine render cho phép tải về miễn phí như MachStudio Pro của StudioGPU, một engine render hỗ trợ cả 2 tập lệnh CUDA và OpenCL với sự chống lưng của DirectX API trong thư viện DirectX của Microsoft. Đấy là một trong những phần mềm khá thú vị, và thực tế sự miễn phí đã thực sự khiến nó nổi tiếng. Kể từ khi bài review này được viết, StudioGPU đã đóng cửa. Tuy nhiên, bạn vẫn có thể download MachStudio Pro trên CNET và một số trang download khác.

Mặc dù có nhiều sự lựa chọn trong phạm vi này, nhưng lĩnh vực CG hiện nay được phân chia dựa vào khả năng sử dụng tăng tốc GPU. Một số studio đi theo hướng công nghệ (sử dụng GPU để render), số khác thì cảm thấy các bộ render GPU không thể vượt trội hơn những render dựa trên nền tảng CPU về mặt chất lượng xuất. Một trong những sự thỏa hiệp chung là sử dụng các phép render dựa trên GPU chỉ trong các trường hợp đặc biệt hay ở quá trình pre-viz, để dành các bước render cuối cùng cho CPU. Một trường hợp điển hình là Sony Pictures Imageworks, hãng này sử dụng bộ render độc quyền có tên là Splat của hãng dựa trên GPU, để xử lý và render các cảnh kỹ xảo; và engine render Arnold dựa trên CPU được dùng để render các bước trau chuốt thêm.
--oO Phần 2 - Benchmark và các kết quả (Tiếp theo và hết) Oo--

Quá trình thử nghiệm
Hãy đến với bữa tiệc thử nghiệm thịnh soạn này! Với hệ thống thử nghiệm, tôi vẫn sử dụng đúng bộ Z800 workstation của hãng HP. Nó được trang bị 2 bộ vi xử lý sáu nhân Xeon X5680 CPU sử dụng vi kiến trúc 32nm và chạy ở xung nhịp 3.33GHz. Hệ thống này chạy hệ điều hành Windows 7 64-bit và được trang bị 18GB bộ nhớ DDR3 và sử dụng ổ cứng Seagate SAS drive có tốc độ 15000 RPM, cấu hình này đáp ứng mọi nhu cầu trong cuộc thử nghiệm này.
Màn hình thử nghiệm là một cặp màn hình 30-inch, mỗi màn hình được thiết lập ở độ phân giải 2560 x 1600 và cung cấp một độ phân giải tương đương với 5120 x 1600.

Về phần mềm thì tôi sử dụng các phần mềm Autodesk 3ds Max 2012, Maya 2012, Softimage 2012 và Mudbox 2012; NewTek LightWave 10; và một loạt các ứng dụng benchmark khác bao gồm Luxology modo 501 và Maxon Cinema 4D; Maxon Cinebench dùng để benchmark tổng hợp; Foundry Mari; mental images iray; FurryBall renderer của Art And Animation Studio và cả Mach Studio Pro của StudioGPU.

Trừ khi có những ghi chú hay quy ước khác, các điểm đo được dưới đây sẽ tương ứng với số khung hình đạt được khi chạy thông qua một loạt các tác vụ phức tạp trên các scene thử nghiệm (các phép tính toán hình học và các chi tiết áp vân sẽ thể hiện trên hình ảnh), và các minh họa cho các chỉ số thấp nhất và cao nhất sẽ xuất hiện trong suốt quá trình thử nghiệm. Đáng buồn là tất cả các scene được dùng cho các phép thử nghiệm này đều là các tài nguyên độc quyền và bởi vậy không cho phép bạn tải về.

Tuy nhiên, nếu bạn muốn vẫn có thể thực hiện các phép thử nghiệm cho riêng mình bằng việc tải về Maxon Cinebench cho các phép benchmark tổng hợp và render thử một scene thông qua việc tải về và test với FurryBall.

CÁC KẾT QUẢ BENCHMARK

Autodesk 3ds Max 2012

3ds Max là một ứng dụng lớn khác của Autodesk, chuyên về modeling, animation và rendering. Đây cũng là ứng dụng duy nhất trong thực tế ở cuộc thử nghiệm này cung cấp cho người dùng đầy đủ cả 3 lựa chọn cho chế độ hiển thị: the Nitrous viewport (một tùy chọn dành cho phiên bản DirectX được tối ưu bởi Autodesk), DirectX 9 và 10, và OpenGL. (Nếu NVIDIA và AMD cung cấp một driver cải thiện hiệu năng riêng cho Max 2012, thì đó sẽ là tùy chọn thứ 4). Trong bài thử nghiệm này, tất cả các scene được thử nghiệm ở góc nhìn Nitrous viewport.



Lúc này, các card NVIDIA Quadro mới tỏ ra vượt trội đáng kể so với các card FirePro về mặt hiệu năng, trừ các card Quadro FX đời cũ. Trong thế hệ Quadro Fermi, mức độ hiệu năng tỏ ra tăng lên rất nhiều so với mức giá tương ứng. Với Quadro 6000 chiếm lĩnh vị trí thống trị, Quadro 5000 ở vị trí thứ 2, vị trí thứ 3 thuộc về 4000 và vị trí thứ tư là Quadro 2000; tiếp theo sau đó lần lượt là FirePro V7900 và V5900; và các dòng FirePro còn lại của AMD xếp theo thứ tự về mức giá, xếp cuối cùng là FirePro V4800 và FirePro V3800.

Xếp thứ tự trong cuộc đua 3ds Max 2012 lần lượt là (theo thứ tự giảm giần)
Quadro 6000
Quadro 5000
Quadro 4000
Quadro 2000
Quadro FX 5800
Quadro FX 3800
FirePro V7900
FirePro V5900
FirePro V8800
FirePro V7800
FirePro V5800
FirePro V4800
FirePro V3800

Autodesk Mudbox 2012

Giống như Maya và Softimage, phần mềm chuyên về sculpt này của Autodesk cũng sử dụng OpenGL làm nền tảng công nghệ hiển thị. Tuy nhiên, không giống như các ứng dụng DCC truyền thống khác, Mudbox làm việc với các mô hình có số polygon rất cao (một scene ‘trung bình’ trong Mudbox cũng có khoảng 8 triệu polygon hoặc nhiều hơn, trong khi các ứng dụng khác thì một scene phức tạp đôi khi cũng chỉ có tầm 2-5 triệu polygon mà thôi.) Điều này dẫn đến việc nó cần đến rất nhiều RAM của card đồ họa, do vậy các card đồ họa thực sự tìm thấy mảnh đất thể hiện và thi thố ở đây.

Một số bạn có hỏi rằng tại sao tôi không đưa các phép đo của ZBrush vào bài viết này. Câu trả lời rất đơn giản, hiệu năng khung nhìn của Mudbox phụ thuộc và dựa trên card đồ họa, trong khi khung nhìn của Zbrush lại sử dụng công nghệ render khung nhìn độc quyền của Pixologic dựa trên CPU, do vậy việc cài đặt card đồ họa hầu như không ảnh hưởng tới hiệu năng viewport của ZBrush.
Quay lại với các phép thử cả Mudbox, mỗi một card đồ họa sẽ được đánh giá theo 2 cách khác nhau. Đầu tiên là một phép đo tổng quan về hiệu năng khung nhìn trong khi thực hiện các lệnh pan, rotate hay zoom mô hình trong scene, trong khi cách đánh giá thứ 2 chính là các phép đo phản hồi từ phần mềm trong khi tiến hành đẽo gọt mô hình trên Mudbox.

Các kết quả benchmark được ghi nhận khi toàn bộ mô hình đã được hiển thị trong viewport, cũng như khi Mudbox thực hiện một số chọn lọc và rút gọn hình học thông minh khi bạn zoom vào cận cảnh mô hình, bất chấp việc các polygon sau khi thoát khỏi khung nhìn (nằm ngoài viewport) sẽ được loại bỏ để cải khiện tốc độ khung hình trên viewport.

Một lần nữa, chúng ta lại chứng kiến sự lật đổ ngoạn mục của các dòng card Quadro đến từ NVIDIA thông qua việc các vị trí dẫn đầu đều lần lượt thuộc về NVIDIA Quadro 6000, 5000 và 4000, tiếp theo sau là FirePro V7900 và V5900.
Quadro 6000
Quadro 5000
Quadro 4000
FirePro V7900
FirePro V5900
FirePro V8800
FirePro V7800
Quadro FX 5800
Quadro 2000
Quadro FX 3800
FirePro V5800
FirePro V4800
FirePro V3800
(Có lẽ các mô hình đa lớp có tới 33.6 triệu đa giác đã trở nên quá tái với các card đồ họa chỉ được trang bị tầm 512MB và 1GB bộ nhớ, việc phân chia cấp độ xuống tầm 8.5 triệu polygon hoặc 2 level với số polygon ở mức 2 triệu trong trường hợp FirePro V3800 thì hiệu năng sẽ tăng đáng kể.)

Mari 1.3v2
Mari là một ứng dụng 3D texture-painting giống BodyPaint 3D của Maxon, vốn được phát triển riêng tại Weta và giờ được tung ra thị trường bởi The Foundry. Nó được thiết kế cho vẽ các chất liệu 3D trên các mô hình có số polygon cao, và làm việc với các texture có độ phân giải siêu cao. (nó có thể làm việc với các map có độ phan giải lên tới 32768 x 32768 trên các mô hình có tới hàng triệu polygon)

Đây lại là lúc mà Quadro 6000 và 5000 nắm thế chủ động: Trong khi các chỉ số khuyến cáo tối thiểu ở mức 1GB RAM trên card đồ họa, thì việc bạn sở hữu các card đồ họa được trang bị tới 1.5GB bộ nhớ sẽ giúp bạn bắt đầu tiếp cận được những texture độ phân giải cao mà Mari cung cấp.
Hiện giờ, Mari chỉ chạy trên phần cứng NVIDIA nên không lạ gì khi các dòng Quadro chiếm vị trí độc tôn. Cụ thể Quadro 6000 chiếm vị trí dẫn đầu, tiếp theo đó là Quadro 5000, Quadro FX 5800, Quadro 4000, và cuối cùng là FX 3800. Điều bất ngờ là trong phép thử này của Mari thì Quadro 2000 không được hỗ trợ chính thức, và cho dù Mari vẫn sẽ chạy ứng dụng của bạn khi sử dụng Quadro 2000, nhưng nó lập tức bị treo và thoát ra ngoài khi tôi cố mở một file scene.

Multi-application benchmark

Để đối chiếu, tôi cũng đã tiến hành các phép đo benchmark cho viewport với một mô hình đơn xuyên suốt mọi ứng dụng và các chế độ hiển thị đa hệ (multiple display modes). Một file OBJ giống nhau được import vào một scene sạch trong từng ứng dụng 3D để xác định hiệu năng khác nhau giữa các card đồ họa, và cũng là sự khác nhau giữa một loạt các ứng dụng.
Mô hình này chứa khoảng 7.6 triệu đa giác, và được hiển thị theo các chế độ sau:
  • 3ds Max: Nitrous viewport, realistic shading mode
  • MAYA: Viewport 2.0, shaded và textured with ambient occlusion enabled
  • Softimage: shaded và textured mode
  • modo: Advanced OpenGL, shaded mode
  • Cinema 4D: Enhanced OpenGL, shaded mode
  • LightWave: shaded và textured mode.

Maxon Cinebench 11.5

Tôi không phải là người thích các phép benchmark tổng hợp. Đây không phải là lỗi của các kỹ sư viết ra chúng, nó đơn giản chỉ là có quá nhiều tham số để có thể dự đoán chính xác về bất kỳ thành phần phần cứng nào sẽ thực thi tất cả các loại của môi trường sản xuất đó.
Thật thú vị, Quadro 5000 đã chiếm ngôi vương miện với Cinebench. Thật bất ngờ khi ta biết rằng nó đánh bại Quadro 6000 dù được trang bị bộ nhớ ít hơn và xung nhân thấp hơn. Thứ tự lần lượt ở cuộc đua này là:
Quadro 5000
Quadro 6000
FirePro V7900
Quadro 4000
FirePro V8800
FirePro V7800
Quadro FX 5800
FirePro V5800
FirePro V4800
Quadro FX 3800
FirePro V5900
Quadro 2000
FirePro V3800

Rendering benchmark

Tiếp theo chúng ta hãy cùng xem xét các phép đo về điện toán GPU. Đây cũng là chủ đề sẽ đến với các bạn trong bài review các card đồ họa trong tương lai gần trên CGExpress với sự tài trợ từ NVIDIA.

Iray

Iray là một “progressive unbiased renderer” được phát triển bởi mental images, và được tích hợp sẵn trong 3ds Max 2012. Hiện nó chỉ hỗ trợ CUDA nên chỉ dùng được trên các card đồ họa sử dụng GPU của NVIDIA, trên các card của AMD thì nó tự động mặc định chuyển về chế độ render bằng CPU.
Ở đây bạn có thể thấy được sự tăng tốc và cải thiện hiệu năng đáng kể khi sử dụng các card NVIDIA Quadro so với khi chỉ render bằng CPU. Bổ sung thêm sự hỗ trợ của Quadro 6000 đã giúp giảm tới 2/3 thời gian render so với việc render chỉ dùng CPU; trong khi dùng Quadro 4000 sẽ cắt giảm thời gian render xuống còn 1 nửa; và Quadro 5000 cũng đạt tầm ấy. Tương đương với hệ thống thử nghiệm 12 nhân CPU 3.33GHz, đây là một kết quả khá ấn tượng.

FurryBall
FurryBall renderer của Art And Animation Studio là một engine render dựa trên nền OpenCL nhằm tính toán các hình ảnh có chất lượng “gần” với chất lượng hình ảnh thành phẩm (final-quality image) trong viewport của Maya. Cho dù tôi chỉ mới dùng qua phần mềm này software, nhưng ấn tượng đầu tiên của tôi là khá tích cực và tôi sẽ còn tìm hiểu sâu về nó trong các bài viết sắp tới của mình. Benchmark được hoàn tất với một vài scene mẫu miễn phí từ nhà phát triển.
Với các engine render tăng tốc bằng GPU khác, lượng bộ nhớ có sẵn trên GPU đóng vai trò chủ chốt về hiệu năng, được minh họa rõ nét nhất là sự vượt trội của Quadro 6000 nhờ được trang bị tới 6GB bộ nhớ và 4GB bộ nhớ trên Quadro FX 5800, tiếp theo sau lần lượt xếp theo mức trang bị bộ nhớ giảm dần là FirePro V8800, FirePro V7800, Quadro 5000, FirePro V7900, Quadro 4000, Quadro 2000, FirePro V5900, V5800, Quadro FX 3800 và FirePro V4800. Riêng FirePro V3800 thì không chạy nổi Furrry Ball và bị treo.
NHẬN ĐỊNH TOÀN DIỆN
Việc hiệu năng giống như quả bóng bàn bị đẩy qua lại giữa các dòng card xuyên suốt trong các thử nghiệm ở lần benchmark này khiến cho việc xếp hạng và công bố kẻ chiến thắng tuyệt đối là không thể, thậm chí là việc nhận định 1 kẻ chiến thắng đến từ NVIDIA và AMD cũng bất khả thi.
Tuy nhiên, nếu được chọn kẻ gần như chiến thắng trong mọi cuộc đua ở lần thử nghiệm này thì ta có thể thấy NVIDIA Quadro 6000 là cái tên sáng nhất và xứng đáng nhất. Nó là một “con quái vật” đồ họa, được trang bị bộ nhớ lớn hơn bất kỳ đối thủ nào và thậm chí là có bộ nhớ còn lớn hơn bộ nhớ chính của bất kỳ máy tính nào xuất xưởng trong vài năm trở lại đây. Điều này dẫn tới kết quả tất yếu là nó lần lượt chiếm ưu thế trong hầu hết các phép thử GPU render, và chúng ta sẽ còn có dịp gặp lại và nắn gân nó trong các cuộc thử nghiệm sắp tới. Tuy vậy, để trả giá cho hiệu năng này thì mức phí bỏ ra là không nhỏ, và con số 4000USD cho “con quái vật” Quadro 6000 sẽ là rào cản không nhỏ với rất nhiều artist và người tiêu dùng.

Nhìn chung, các model hiện nay trong dòng Quadro của NVIDIA có hiệu năng thực thi rất tốt. Hiệu năng cao hơn đáng kể so với các dòng Quadro FX trước đây, và các card NVIDIA dành chiến thắng tuyệt đối khi bạn sử dụng các ứng dụng 3ds Max, Mudbox, modo và Cinema 4D. Trong khi như bạn đã biết, Quadro 6000 hiện là kẻ thống trị và nhanh nhất của NVIDIA, thì cá nhân tôi vẫn khuyên bạn nên để ý đến Quadro 5000 nếu bạn cần đến nhiều tác vụ điện toán GPU; hoặc Quadro 4000 cho việc cân bằng giữa hiệu năng và giá cả.
Tuy vậy, trong khi ấn tượng với dòng Quadro của NVIDIA về mặt hiệu năng, thì tôi lại muốn được thấy chúng hỗ trợ nhiều màn hình hơn trong tương lai (hiện nay chúng chỉ mới dừng lại ở mức hỗ trợ 2 màn hình / card).

Còn với dòng ATI FirePro của AMD, mọi thứ trông cũng khá tốt. Chúng tỏ ra khá mạnh và dẫn đầu khi chạy các ứng dụng như Maya, Softimage và LightWave; trong khi Quadro 6000 dành trọn vương miện về hiệu năng thì cá nhân tôi muốn nhắc tới FirePro V7900 với đề cử vương miện của một chiếc card chuyên nghiệp có mức giá tốt nhất nếu như bạn không cần đến quá nhiều các phép tính GPU. Nó cạnh tranh với Quadro 4000 về mức giá nhưng trong nhiều phép đo ở cuộc thử nghiệm này nó đã đánh bại cả Quadro 4000 và 5000, thậm chí trong một số phép đo nó còn ngang ngửa hoặc đánh bại cả ”con quái vật” Quadro 6000. Bên cạnh đó là V7800, một sự cải thiện đáng kể đủ để đánh bại người anh em khổng lồ FirePro V8800 của nó.
THAY LỜI KẾT
Xét về tổng quan, như đã thể hiện mạnh mẽ ở các cuộc thử nghiệm trên và trong thực tiễn, mọi thứ trong lĩnh vực đồ họa đang diễn ra khá tốt với cả dòng Quadro của NVIDIA và FirePro của AMD. Sự chi phối thị trường đồ họa cao cấp của NVIDIA cũng không quá nhiều nhưng vẫn thể hiện rõ, tuy nhiên việc bạn quyết định mua dòng nào sẽ được quyết định bởi 3 yếu tố: Ứng dụng đồ họa mà bạn sử dụng, chi phí mà bạn sẵn sàng chi trả và bạn thích dòng nào hơn. Chẳng hạn như cá nhân tôi – người dịch bài viết này - vẫn thích NVIDIA nhờ sự hỗ trợ của các dòng card NVIDIA với các tập lệnh OpenCL, PhysX, CUDA và Direct-Compute…

Các card NVIDIA vượt trội hơn về hiệu năng trong nhiều ứng dụng so với FirePro, nhưng mức giá lại mắc hơn so với đối thủ AMD. Các dòng FirePros rẻ hơn, nhưng không được hỗ trợ nhiều như Quadros trong một số ứng dụng và lại chỉ hỗ trợ OpenCL, bị hạn chế trong một số engine tăng tốc render bằng GPU. Điều đó khiến các card NVIDIA (có sự hỗ trợ của các tập lệnh OpenCL, PhysX, CUDA và Direct-Compute…) chiếm ưu thế và được sử dụng phổ biến hơn.
Theo cgexpress

Thông tin nhà nhập khẩu và phân phối Anh Đức JSC:
CÔNG TY CỔ PHẦN ANH ĐỨC
Website: www.fastest.com.vn – Email: sales@fastest.com.vn
♦ Trụ sở Hà Nội:
Showroom Tư vấn Dự án - Giải pháp và Bảo hành Dịch vụ
Đ/c: Tầng 8 - Thủy Linh Building, Số 33 Thái Hà, Đống Đa, Hà Nội
ĐT: (04) 3514.9887 - Hotline : 0987 192 244
♦ Chi nhánh TP.HCM:
Showroom Tư vấn Dự án - Giải pháp và Bảo hành Dịch vụ
Đ/c: 31 Trần Đình Xu, Quận 1, TP.HCM
ĐT: (08) 3837.4169 - Hotline: 0938 996 323

Unknown

CÔNG TY CỔ PHẦN ANH ĐỨC - Nhà phân phối ủy quyền sản phẩm NVIDIA Quadro tại Việt Nam.

 

Copyright @ 2013 NVIDIA Quadro.