우리가 오픈 API를 이용하여 서비스에서 제공하는 정보로는 혼잡도, 미세먼지, 편의시설(ex.물품보관함 위치), 주변 건물 등의 정보들이 있다. 여기에 환승정보나 실시간 도착 정보등과 같은 지하철 관련 정보들도 추가적으로 가져올 수도 있다. 이는 AWS 솔루션에서 IoT서비스를 통한 데이터 수집 또는 kinesis stream의 역할을 하게 된다. 이러한 다양한 데이터를 모아 제공하였을 때 그것을 분석할 수 있는 여러 AWS 서비스들이 있다. 그 과정을 자세히 살펴보면, 먼저, 이렇게 모인 데이터들은 s3나 RDS에 저장되어, 다른 서비스들과 연동되어 사용되어질 수 있는 형태가 된다. EMR로 방대한 양의 데이터 배치를 분석 및 처리할 수 있고 , lambda를 이용하여 빅데이터 유관 서비스와 연동처리를 진행할 수도 있다. 또한, Aws 머신러닝 솔루션의 amazon sagemaker서비스는 머신 러닝의 모델 학습과 모델 검증과 관련된 내용을 다룬다. sagemaker에는 최적화된 머신러닝 알고리즘들이 많이 내장되어 있는데, 이런 내장 알고리즘을 이용하여 모델을 구축하려면 여러 데이터들이 필요한데, 이 때 데이터는 직접 수집하고 준비하여야 한다. 머신러닝에 필요한 데이터로는 크게 학습, 검증, 테스트 데이터가 있는데, 이때 앞에서 s3에서 저장한 우리의 오픈 api 데이터들을 가져와 학습데이터로 넘겨줄 수 있습니다. 그 후 sagemaker내에서 제공하는 ResNet과 같은 학습 모델을 사용하여 학습이 이루어질 수 있습니다. 이 후 모델 학습이 완료되면, 모델을 생성하고 이에 해당하는 예측 결과를 생성한다. 우리가 충분한 데이터를 제공했을 때, 이러한 aws의 분석 서비스에 적용할 수 있는 것이다. 이와 같이 우리 “지하철 날씨”애플리케이션은 AWS의 서비스와 연관되어 사용될 수 있는 가능성을 가지고 있다.