1. Urban Sim 개요

자율주행/로봇 쪽 조금이라도 건드려봤다면, “Micromobility” (전동 휠체어, 배달 로봇, 소형 이동체 같은 친구들)라는 단어 한 번쯤은 들어봤을거다.
코코봇 에서, 조금 더 편한 테스트를 위해서 시뮬레이터를 만들고 있는데, 크게 MetaUrban과 UrbanSim 이 있다.
오늘은 그 중 UrbanSim에 대해서 이야기 해보고자 한다.


이 시뮬레이터는 무려 CVPR 2025 Highlight 를 받은 친구로 능력이 대단하다 (역시 CoCo Bot인가..?)

해당 논문의 Abstract를 보면 바로 확인할 수 있다 시피 “AI 학습” 중에서도, “환경에 대한 다양한 변수에 대한 AI 자율주행의 역량평가” 를 위한 테스트 배드 임을 알 수 있다.
왜 기존 테스트 배드로는 사용하지 못하냐? 이건 SimWorld가 나온 이유와도 비슷한데, 배달로봇이 다니는 환경이 생각보다 훨씬 더럽다.

  • sidewalk
  • alley
  • plaza
  • crosswalk

등등,,,

차처럼 “도로 위”가 아니라,
사람이랑 섞여서 다니는 공간이라

  • 지형이 일정하지도 않고 (계단, 경사)
  • 장애물도 많고
  • 사람도 계속 움직인다

그냥 환경 난이도가 다르다
그래서 테스트 하기도 매우 어렵기 때문에,
이를 해결하기 위해, 다양한 환경을 병렬적으로 생성하고 학습할 수 있는 구조를 만든 것으로 보인다.

2. 전체 구조: Isaac-Sim

SimWorld는 UnrealEngine이라면,
이 친구는 Nvidia Omniverse를 기반으로 돌아간다.

Omniverse + PhysX + GPU 병렬화 → URBAN-SIM

이 구조를 쓴 이유는

“대규모 + 고성능 학습을 동시에 하겠다”

목적 뿐이다.

엔비디아 생태계에선 GPU의 사용이 편하기에

  • 수천 개 scene을 병렬로 돌리고
  • 다양한 환경을 동시에 학습시키는 구조다

이러한 작업이 이론적으로는 매우 쉬워진다. [필자는 죽을맛이다, 이거 세팅하는게 일이다 그냥]


URBAN-SIM:

  • 여러 환경을 동시에 샘플링

아이디어 자체는 명확한데, 실제 적용에서 어느 정도까지 효율이 나올지는 조금 더 지켜봐야 할 것 같다.


개인적으로 느낀 포인트

이 구조를 보면서 든 생각은 딱 하나였다.

“이거 시뮬레이터라기보다
테스트/학습 파이프라인에 더 가깝다”


그려면 이게 좋은가? 테스트를 병렬적으로 할 수 있는 엄청난 강점이 있는데 MetaUrban도 그렇고,
AI기반 강화학습을 적용시키는 것에는 매우 좋아보이는데… 실제 테스팅을 할 때는?? 그 일부분만 사용할 수 있을 것 같은 느낌이다.

결론적으로

단순히 “돌려보는 시뮬레이터”가 아니라
“학습/평가를 위한 인프라” 라는 것이다.

3. 논문 요약

이 논문의 핵심은 단순하다.

“환경을 많이 만들면, 성능이 진짜 올라가냐?”

이걸 실험으로 검증한 것이다.


URBAN-SIM의 핵심 구조 중 하나인 Asynchronous Scene Sampling을 기반으로
scene 수를 점점 늘려가며 성능 변화를 측정한다.

  • scene 수: 1 → 1024
  • 결과: Success Rate 5.1% → 83.2%


단일 환경에서는 큰 차이가 없지만,
synchronous 방식 대비, scene이 다양해질수록 성능 격차가 크게 벌어지는 점이 인상적이다.

결국 결론은 이거다.

“다양한 환경에서 많이 학습해야, 실제 성능이 올라간다”


이걸 GPU 병렬 구조로 현실적으로 가능하게 만든 것이
URBAN-SIM의 가장 큰 포인트다.

4. 결론

이걸 정리하면 결국 이 플랫폼의 정체성은 명확하다.

1. 이건 “학습 플랫폼”이다

  • RL / 대규모 training 전제
  • 수천 scene 병렬 학습


일반적인 QA / 테스트 환경은

  • 시나리오 기반 테스트
  • deterministic 검증

2. 비용 구조

  • GPU 병렬 (L40S 기준)
  • 환경 생성 + 학습 파이프라인


단순히 “테스트만 하겠다” 수준에서는 확실한 오버스펙이지 않을까?


3. QA 관점에서의 한계

결국 QA에서 테스트베드가 필요한 이유는 “환경 모사” 때문이다.

  • edge case 재현
  • regression test
  • 안정성 검증

위와같은 것을 할 수 있다는 장점이 있고, 이 때문에 여러 타이밍 이슈를 재현할 수는 있다.

요약하자면,

URBAN-SIM은

  • 환경 다양성 ↑
  • 학습 성능 ↑

대신

  • 재현성 ↓ 가능성
  • 디버깅 난이도 ↑

따라서 RL 기반으로 모델을 학습시키는 환경이라면 충분히 검토해볼 가치가 있지만,
단순 테스트 목적이라면 도입 전에 충분한 고민이 필요해 보인다.


결론

이 플랫폼은 강화학습 기반 대규모 학습에는 매우 강력하지만,
일반적인 테스트/QA 환경에서는 오버스펙일 가능성이 높다