인텔에서 라라비의 일반 소비자용 칩 출시를 포기했다는 소식이 들어왔다. 상당히 안타까운 소식이라 할 수 있는데, 이것은 아키텍처의 우수성 여부를 떠나 최종적으로 시장 상황에 따라 승패가 결정된다는 것을 보여주는 사례이다. 좀 더 자세하게 이야기해보자.
저번에도 이야기했지만, NVIDIA의 페르미는, 분할된 메모리 공간을 하드웨어적으로 매핑해주는 유닛의 탑재로 메모리 전체를 단일한 공간으로 바라볼 수 있게 해주면서, 복잡했던 CUDA 프로그래밍 모델을 크게 개선했다. 물론 그렇다고 하더라도 GPU가 다루는 메모리 공간과 CPU가 다루는 메모리 공간이 분리되어 있으므로 불편한 것은 있지만, 하고자하면 그렇게 불편한 것도 아니다. 라라비는 이와 반대로 CPU, GPU가 모두 공유하는 단일한 메모리 공간 안에서 데이터를 다룰 수 있게 해주며, CPU, GPU 어느 쪽이 데이터를 다뤄야 하는지를 간단한 언어 확장으로 지정할 수 있기 때문에 훨씬 나은 프로그래밍 모델을 가지고 있다.
그러나 문제는, 이렇게 우수한 아키텍처나 개발 방법을 가지고도 시장에서 외면을 받은 제품 또한 셀 수도 없이 많다는 것이다. 또, 실리콘 산업의 특징상, 거대한 볼륨이 확보되지 않는다면 이를 전제로 한 제품 생산이 줄줄이 올스톱되어 버린다. 사실, 라라비는 성능상으로는 한번 출시를 해볼만하다고 느껴지지만, 인텔에서 기대하는 것보다 시장에서의 라라비 소프트웨어 연구가 부족한 편이며, 개발자도 부족하다. 이런 상황에서 그대로 라라비를 출시하는 것은 자칫하면 인텔의 CGPU 프로젝트 자체에 커다란 타격을 줄 수 있으므로, 지금 상태에서의 라라비 일반 소비자용 출시를 포기한 결정은 처라리 현실적이라 할 수 있다.
과거를 돌이켜보면, 윈도우 3.1의 저열한 멀티미디어 기능 때문에 인텔이 진저리를 내면서 NSP(Native Signal Processing)라는 것을 만들겠다고 밝힌 적이 있었다. 이것은 운영체제를 거치지 않고 직접 멀티미디어 데이터 같은 커다란 데이터를 처리하겠다는 것인데, 즉시 업계로부터 말도 안되는 인텔의 야욕이란 비난을 들으면서 사장되었던 적이 있다. 물론 라라비는 이와 비할 바가 아니다. 지금의 인텔은 예전의 인텔이 아니며, 라라비의 방향성, 아키텍처의 우수함은 여전히 평가할만한 것이지만 최종적으로 이를 결정하는 것은 소프트웨어, 개발자, 소비자들을 포함한 시장이다. 그 점에서 NSP와 라라비는 어느 정도 공통점을 지닌다.
여튼, 이렇게 되면서 NVIDIA는 페르미의 보다 강화된 산술 연산, 그리고 배정밀 연산 기능으로 보다 여유롭게(사실 여유로운 것은 아니지만) 시장 공략에 나설 수 있게 되었으며, 페르미의 일반 소비자용 버전(지포스)은 오랜 적수였던 ATI를 겨냥 할 수 있게 되었다. 또, 시간을 벌게 되면서 페르미에 개발자들을 끌어들일수록 인텔의 라라비는 점점 등장이 힘들어진다. 이것은 개발자들에게 좋은 소식이 아닌데, 복잡한 프로그래밍 모델이라고 하더라도 시장 지배적인 플랫폼이 되어버리면 개발자는 이를 지원해야 하기 때문이다. 과거 8086의 기묘한 세그먼트 - 오프셋 어드레싱이 기술적으로 탁월해서 사람들이 이를 썼던 것은 아니다. 또, NVIDIA가 작년부터 몰래몰래 과거 트랜스메타의 전직 개발자들을 모으고 있다는 소문이 도는데, 다들 알다시피 트랜스메타의 크루소는 x86 마이크로코드를 소프트웨어적으로 처리하는 CPU였다. 크루소는 다른 마이크로 코드를 자신의 명령어로 변경하는 코드 모핑 기술이 강점이다. 이 과정은 하드웨어와 소프트웨어 양쪽이 모두 관련된다(리누스 토발즈도 한 때 여기서 일했던 적이 있었다). 즉, 최종적으로는 NVIDIA가 페르미에서 진화한 x86 호환 칩을 만들겠다는 이야기도 결코 허황된 이야기로만 치부할 수 없는 노릇이다. 더구나 라라비가 현실적으로 NVIDIA나 ATI가 GPU 시장에서 쌓아온 그래픽 관련 기술을 단기간에 따라잡을 수 없다는 것이 증명된 이상 더욱 그렇다. 법정에서 인텔과 NVIDIA의 치열한 신경전은 결국 x86 마이크로 코드에 대한 라이센스 시비로 이어질지도 모른다.
ATI 역시 한 숨 돌리게 되었는데, 현재 TSMC의 40 나노 공정 문제만 해결되면 보다 적극적으로 시장에 HD 5x 시리즈를 투입하면서 이를 기반으로 다음 전쟁을 준비할 수 있는 기회를 얻게 되었다. AMD-ATI의 차세대 퓨전 아키텍처를 살펴보면 인텔의 하이퍼스레딩과 달리 정수 연산 기능이 코어수에 거의 선형 비례로 성능이 확장되는 구조이며, 부동소수점 연산이나 벡터 연산은 GPU 파트로 완전히 넘어가는 것으로 보인다. 인텔의 하이퍼스레딩은 적은 다이 면적을 차지하는 대신, 일정 정도 이상의 스레딩 성능을 얻기 힘들다. 또, 인텔과 달리 강력한 GPU 파트를 자회사로 소유하고 있으므로, CPU - GPU의 퓨전에 대해서 기술적인 문제 이외의 복잡한 생각을 할 필요가 없다.
이제, 2010년 1/4분기 GPU 시장은 좀 더 복잡하게 되었다. 실리콘 시장의 신은 한번 주사위를 굴려보며 판돈을 올리는 쪽을 즐기려는 듯 하다.