새로운 단계에 들어서는 유럽 오픈사이언스 클라우드 프로젝트

올해 EU가 연구자들의 완전한 오픈 사이언스 추구 지원을 위해 대륙 전역의 무수한 데이터 공유 시스템의 연합을 추진함으로써 유럽 ​​오픈 사이언스 클라우드(EOSC)는 새로운 단계에 진입하고 있다.

해당 클라우드는 2018년에 공식적으로 개시되었으며 이후 Horizon2020은 약 50개 관련 과제에 자금을 지원하여 2020년까지 3억 2,000만 유로를 투자했다.

이러한 상향식 과제는 클라우드의 토대를 마련했으며 이에 유럽 전역의 이해관계자가 참여했다. 그러나 EOSC의 비전은 혼란스럽고 복잡해졌다. EOSC 협회 회장이자 델프트 공과대학의 전 총장인 카렐 루이벤(Karel Luyben)은 사이언스 비즈니스(Science Business)를 통해 "우리는 이제 융합단계라고 부르는 것에 진입하고자 한다"고 말했다.

이를 위한 수단은 연구제공기관, 연구펀딩기관, 서비스 제공업체 및 기타 조직을 한데 모으는 유럽집행위와 EOSC협회 간 공동프로그램된 파트너십이 될 것이다. 다른 많은 유럽 이해관계자들과 함께 협회는 OS클라우드를 실현하기 위한 로드맵을 설정했다.

기술적으로 3년 전에 시작되었지만 EOSC는 문서로만 작동한다. 이 파트너십은 2030년까지 시스템을 완전히 통합 및 배포하여 2백만 명의 연구자에게 서비스를 제공하는 것이 목표다.

집행위는 향후 7년 동안 이 시도에 4억 9천만 유로를 투자할 것이며, 10배 더 많은 자금이 다른 곳에서 나올 수도 있다.

루이벤(Luyben)은 이 오픈사이언스 클라우드가 지속적인 과정이라고 말한다. 공식적으로 운영 또는 일정한 연구자에게 서비스를 제공할 날짜는 정해져 있지 않다. 끊임없이 진화하는 자원 네트워크인 월드와이드웹과 비슷하다. 그는 월드와이드웹이 정확히 어느 날짜부터 존재했는지 알 수 없다는 점을 지적했다.

EOSC의 차별성은 유럽에 대한 연구, 이후 전 세계에 대한 연구 관련된 데이터 저장소를 연결한다는 것이다. 각각은 검색 가능성, 접근성, 상호운용성 및 재사용성의 FAIR 데이터 원칙에 기초해야 한다.

문제는 모든 연구데이터가 원칙에 부합하고 네트워크를 통해 액세스할 수 있도록 하는 것이다. 오늘날 대부분의 연구데이터는 온라인이 아니고 연구자들이 쉽게 접근할 수 없으며, 무수히 많은 다양한 표준과 방법론에 따라 다른 시스템에 저장된다.

네트워크에 연결하는 것은 어려운 작업이다. 이를 해결하기 위한 다음 큰 단계는 다양한 데이터 인프라에서 데이터와 서비스를 발견, 공유, 접근 및 재사용하는 수단인 EOSC 코어를 만드는 것이다.

인터넷이 표준 프로토콜을 사용하여 파일을 교환하고 조작하는 것처럼 EOSC는 데이터 패키지를 혼합하기 위한 FAIR 개방형 표준이 필요하다.

루이벤은 “이 모든 것의 코어에서 데이터를 작은 입자-패키지로 만들 수 있다,” “그것들을 캡슐화하고 표준을 개발한 다음, 그것들을 보내고 공유하고 다시 결합할 수 있다”고 말했다. 또한 그는 “FAIR 원칙을 사용하여 수행하면, 이것을 가능토록 우리 기계에 적합한 소프트웨어가 요구 된다”고 강조했다.

EOSC 코어를 구축하기 위한 3,500만 유로의 조달 요청이 내년에 시작될 것으로 예상된다.

 

토대 마련

EOSC 상위인 EOSC-허브 하에서 자금을 지원받은 3천만 유로의 과제는 미래 EOSC와 그 핵심을 위한 토대를 마련했다. 여러 EU 연구 인프라에서 제공업체를 동원하고, 참여를 위한 공통규칙을 설정하고, EOSC 포털을 통해 서비스를 통합했다.

그 결과 이미 20,000명 이상의 연구자들에게 서비스를 제공한 프로토타입이 탄생했다. 클라우드 제공업체와 데이터센터 연합인 EGI Foundation의 EOSC 허브 코디네이터이자 이사인 티지아나 페라리(Tiziana Ferrari)는 사이언스 비즈니스(Science Business) 통해 "아키텍처 관점에서는 기능면에서 동일하다"고 말했다.

이는 거대한 디지털 연구 커뮤니티처럼 작동한다. 한 쪽은 제공자이고 다른 쪽은 연구자다. 그러나 핀란드 IT 과학센터인 CSC의 EOSC-hub 과제 책임자이자 비즈니스 통찰력 및 성장 책임자인 퍼 오스터(Per Öster)는 “이 둘은 상당 부분 겹친다”고 지적했다.

오스터(Öster)는 해당 포털을 숍윈도우에 비유했다. 이는 과제의 구체적인 결과이지만 연합을 위한 솔루션 찾기, 참여규칙 정의 및 서비스 관리 프레임워크와 같은 많은 활동들이 그 뒤에 발생했다.

서비스 설명에 대한 메타 데이터 정의와 같은 다소 사소한 작업이 팀의 주요 이정표였다. 그러나 서비스를 사용할 수 있게 하려면 먼저 이를 사용자에게 제시하고 설명하는 작업이 필요했다. 페라리(Ferrari)는 이것은 주요 장애물 중 하나였지만, 이제는 사용자에게 서비스를 제공하는 일관된 방법을 갖게 되었다고 말했다.

이 과제는 3월에 종료되었지만 EOSC 세계의 다른 이니셔티브는 이미 그 결과를 기초로 하고 있다. 페라리는 “우리는 다리의 기둥을 짓고 있으며, 이제 우리는 그 위에 도로를 건설할 수 있고 자동차를 가질 수 있다”고 말했다.

 

국경 없는 과학

이 파트너십은 20년대 말까지 2백만 명의 연구자에게 서비스를 제공하는 것을 목표로 한다. 유럽 ​​연구자들에게 서비스를 제공하는 것이 첫 번째 경계이지만 네트워크는 무한정 계속 성장할 것이다.

루이벤은 지금부터 20년 후 전 세계 연구 데이터의 50%가 FAIR 원칙에 따라 제공 및 활용될 수 있을 것으로 예상했다.

EOSC(Europe-wide open science cloud)의 개념은 2015년에 처음 등장했다. 그 이후로 이 아이디어는 큰 변화를 겪었으며, 루이벤에 따르면 약어 EOSC를 구성하는 네 단어 모두 기술적으로 잘못되었다.

첫째, 클라우드는 유럽에만 서비스를 제공하는 것이 아니라 유럽구조가 설정되면 전 세계의 연구 데이터를 연결하는 것을 목표로 한다. 둘째, 일부 데이터는 열 수 없기 때문에 열린 데이터에 관한 것이 아니며, 그것은 FAIR 원칙을 준수해야 한다. 셋째, 데이터는 과학 분야에만 국한되지 않으며, 모든 종류의 정보에 액세스할 수 있다. 넷째, 몇 개의 빅데이터 센터에 정보를 저장하는 클라우드가 아니라 전 세계의 저장소와 데이터 저장시설을 연결하는 네트워크다.

이는 과학이 보다 개방적인 방향으로 이동함에 따라 필요한 발전이다. 루리벤은 집행위의 노력과 자금이 없었더라도 이러한 과학 클라우드는 발생할 것이라고 믿는다. 그러나 그것은 덜 유럽적이고 더 미국적인 것일 수 있다.

호주, 캐나다 및 미국에서 유사한 이니셔티브가 전 세계적으로 발생하고 있다. 루이벤은 "궁극적으로 유럽 문제가 아니다“라고 지적한다. 그는 "전 세계 네트워크에 참여하지 않으면 EOSC를 만드는 것은 소용이 없다"고 말했다.

그러나 EU와 글로벌 차원에서 이러한 과제의 성공 여부는 연구자들이 데이터를 공유하고 OS문화를 조성하며 FAIR 원칙을 채택하려는 의지에 달려 있다.

오늘날 대부분의 연구자들은 보상 없이 데이터를 공유하는 것을 주저하고 종종 FAIR가 의미하는 바를 잘못 해석한다. 이것은 바뀔 수 있지만, 이는 곧 연구자들이 일하고 보상받는 방식이 변화해야 한다는 것을 의미한다. 루이벤은 “이는 하루아침에 하향식으로 이루어질 수 있는 과정이 아니다”고 말했다.

 

SOURCE : SCIENCE BUSINESS

Print Friendly, PDF & Email
Facebook
Twitter
LinkedIn
Pinterest