이제 출시를 목전에 두고 있는 페르미, 그러니까 470 / 480 GTX에 대해 어느 정도 평가를 내려도 될 듯 하다. 이들 페르미 초기 모델들의 시장에서의 성공 여부는 대단히 회의적이다. 처음부터 ATI HD 5x 시리즈대에 비해 가격 대비 성능비는 처절할 것이라는 예측을 했는데, 페르미가 이들에 대해서 장점을 가질 수 있는 것은 압도적인 성능뿐이었다. 그러나, 그것조차 발열 문제 때문에 대단하지 않을 것으로 추측되는 지금, NVIDIA는 한동안 고전을 면치 못할 것으로 보인다.
특히, 비슷한 방향을 지향했던 인텔의 라라비도 사정은 다르지만 출시를 포기했는데, 이와 관련해 몇 가지 관전 포인트가 생겼다.
라라비는 아키텍처와 같은 기술적인 부분은 대단히 훌륭했지만, 소프트웨어 지원의 미비로 최적의 출시 타이밍을 놓쳐 프로젝트 방향 자체가 수정되었다. 그러나, 페르미의 경우 소프트웨어 지원과 같은 외적인 문제보다 시장에서 민감하게 받아들이는 가격, 발열과 같은 문제 때문에 좌초 위기에 놓여 있다. 페르미 아키텍처 설계 방향의 문제라기보다는, GPGPU라는 주제에 대해 인텔이나 NVIDIA나 '실제로 돌아가는' 제품을 만드는 것이 얼마나 어려운가를 보여주는 것이라 할 수 있을 것이다. 즉, 약속한 기능을 우겨넣기는 했지만 수율, 발열과 같은 문제와 관련하여 균형을 상실한 페르미 초기 버전과 달리, 라라비는 인텔의 칩 제조에 관한 오랜 노하우 때문에 그럭저럭 쓸만한 프로토타입을 선보였다. 그러나, OpenGL이나 DirectX와 같은 전용 하드웨어를 가진 소프트웨어의 지원을 받지 못해 최적의 시장 진입 타이밍을 놓쳤다고 평가할 수 있다. 라라비는 현재 완전히 독립적인 칩보다는 그래픽 코어의 형태로, 인텔 기존의 CPU 코어와 헤테로 형식의 코어로 통합될 것으로 보여진다. 인텔의 로드맵이 약간 수정되기는 하겠지만, 라라비 자체가 독립적인 GPU보다는 궁극적으로 시장 타켓에 따라 코어들의 이종 결합을 염두에 두고 있으므로, 한 세대를 쉬어가는 것은 전체적인 면에서 볼 때 그렇게 문제 되는 것은 아니다. 오히려, 문제는, 라라비가 GPU보다는 CUDA와 같은 방향성을 지니면서 리얼타임 렌더링을 서브 집합으로 포함하는, 슈퍼 컴퓨팅으로 확대되는 처지에 있어서의 소프트웨어 지원이다.
페르미는 반대로, 강력한 3D 렌더링 기능을 바탕으로 GPGPU라는 주제에 도전했다. 기존의 SP들을 CUDA Core라고까지 변경하면서, 새로운 시장에 대비하여 많은 기능을 구현하고 아키텍처를 재편했지만, 초기 버전들이 늘상 그렇듯이 적절한 타협점을 찾지 못해 성공 여부는 비관적이다. 찰리가 악담을 퍼부었던 것과는 달리, 아키텍처가 지향하고자 하는 방향성은 틀리지 않은 만큼 한 세대를 넘어갈 밥줄만 든든하다면 다음 세대에는 일반 사용자들까지 괜찮은 물건을 쥘 수 있을 것이다. 프로그래밍 모델이 더럽다고 하더라도, 개인적인 의견이지만 DirectCompute보다는 CUDA가 훨씬 낫다.
여튼, 초기 시장 진입은 인텔이나 NVIDIA나 모두 우여곡절을 겪고 있는 것으로 평가할 수 있다. 이제 남은 것은 AMD-ATI인데, AMD-ATI 로드맵에 그려진 차기 아키텍처, 불도저는 일단 긍정적으로 평가할 수 있다(직접적인 관련이 없더라도, 퓨전 프로세서와 연관이 있으므로). 일단 ATI HD 5x 시리즈가 충분히 시장에서 한동안 선전해줄 것으로 기대되는 만큼, 이들의 향후 전쟁은 희망적이다. 다이 면적을 적게 차지하는 대신 성능 향상폭이 제한적인 인텔의 하이퍼 스레딩에 비해 코어 수 증가에 따라 선형적인 정수 연산 능력 향상을 약속하는 불도저 아키텍처의 첫 인상은 매력적이다. 불도저 아키텍처는 궁극적으로 퓨전 프로세서와의 통합을 염두에 두고 있으며, 부동소수점 및 벡터 연산을 GPU에게 넘기는 방식으로 CPU - GPU 통합을 그리고 있다. 이것은 균형잡힌 접근법(= 싼 값)이라 기대해볼만한 발상이다. 퓨전 프로세서는 CPU 코어와 GPU 코어의 L3 캐시 통합 사용을 염두에 두고 처음부터 쉽게 코어 수를 늘릴 수 있도록 디자인되고 있는데, 이것은 인텔이나 NVIDIA와 같은 업계 공룡들의 정공법과는 다른 방법이다. 다만, 문제는 말처럼 그렇게 쉽게 CPU와 GPU를 붙이기만 하면 될 일이겠냐는 것이다(과거 이름뿐인 듀얼코어 스미스필드처럼). 동종 코어 사이의 캐시를 공유하는 것조차 녹록한 문제가 아닌데, 이종 코어를 통합하는 것은 캐시 동시성 문제 이상으로 복잡한 문제들을 풀어내야 한다. 이런 면에서, 퓨전 프로세서가 실용적인 접근법을 취하고 있더라도 적기에 프로토타입을 선보일 수 있을지 의문이다. 또, DirectCompute 외에는 당장 쓸만한 소프트웨어 지원을 기대할 수 없기 때문에(OpenCL이 활용되기에는 아직도 세부 표준이 명확하지 않다), 이 또한 AMD-ATI 퓨전 프로세서가 넘어야 할 산이다. 업계의 공룡들조차 헛발질 2번을 날렸는데, AMD-ATI는 이를 잘 극복할 수 있을지 관심이 간다.
새롭게 떠오르고 있는 병렬처리 - GPGPU 시장의 지배적인 아키텍처를 차지하기 위해, 각 업체들의 내놓은 해법은 흥미롭게 느껴지지만 아무래도 개발자들에게는 피곤한 일이다. 그러나, 각 업체들의 해법을 제대로 구현하는, 안정적인 제품들이 어서 출시되었으면 하는 바램이다.