УДК 504.064.37
М.Ю. Катаев, А.К. Лукьянов
Восстановление общего содержания углекислого газа методом эмпирических ортогональных функций из спутниковых данных
Рассматривается описание метода эмпирических ортогональных функций (ЭОФ) и его модификации для решения задачи восстановления общего содержания углекислого газа по реальным данным измерений спутниковым прибором GOSAT. Обсуждается структура программного комплекса, предназначенного для обучения метода ЭОФ и обработки данных измерений. Приводятся результаты обработки данных измеренных спутниковых спектров отраженного от поверхности солнечного излучения в ближней ИК-области спектра для станции Lamont наземной сети TCCON измерения общего содержания СО2 в атмосфере.
Естественные природные факторы и хозяйственная деятельность человека вносят существенные изменения в состав атмосферы за счет изменения содержания аэрозольных примесей и газовых компонент. Замеченные в последнее время существенные изменения погоды привлекают внимание широкого круга исследователей в связи с актуальными оценками ожидаемых последствий различных воздействий (антропогенных и естественных) на климат Земли. Для решения всех возникающих при этом задач необходимо разрабатывать модели пространственно-временного поведения различных компонент атмосферы, в том числе и углекислого газа. Несмотря на то, что измерительных станций в мире работает более двух тысяч [http://www.wmo.int], они расположены неравномерно пространственно и проводят не синхронизированные по времени измерения. Этих измерений достаточно, чтобы построить качественную модель, однако совсем недостаточно для детальной количественной модели, для которой более приемлемы равномерная пространственная и временная сетки. Единственным способом, который максимально полно позволяет проводить регулярные по пространству и времени измерения, является спутниковый метод. Среди спутниковых приборов, а соответственно и подходов к обработке, позволяющих проводить измерения общего содержания СО2 можно выделить Sciamachy [www.sciamachy.org], GOSAT [www.gosat.nies.go.jp], AIRS [airs.jpl.nasa.gov], IASI [smsc.cnes.fr/IASI]. Эти приборы различаются по спектральным и пространственным характеристикам измерений, что, естественно, приводит при обработке данных измерений к различной точности определения общего содержания СО2. Среди указанных спутниковых приборов выделяется прибор GOSAT, который начал измерения с середины 2009 г. и предназначен для мониторингового режима измерений общего содержания СО2 и СН4.
В данной статье нами рассматривается метод эмпирических ортогональных функций (ЭОФ) [1] и его модификация, который применяется для целей обработки данных спутникового мониторинга общего содержания СО2.
Описание составляющих спутникового сигнала. Спутниковый прибор GOSAT представляет собой Фурье-спектрометр среднего разрешения (0,2 cм-1), для которого диаметр пятна обзора составляет около 8 км. Собранное прибором с пятна обзора отраженное солнечное излучение измеряется с соотношением сигнал/шум = 1000/1. Спектральные каналы прибора расположены в ближней ИК и ИК-области спектра: канал 1 - 0,757-0,775 мкм (12900-13200 см-1), канал 2 - 1,56-1,72 мкм (5800-6400 см-1), канал 3 - 1,92-2,08 мкм (4800-5200) и канал 4 - 14,28-5,55 мкм (700-1800 см-1). Для восстановления общего содержания СО2 применяются данные измерений второго канала, в котором расположены полосы поглощения углекислого газа (рис. 1).
Основные составляющие спутникового сигнала связаны с отражением солнечного излучения от поверхности, расположенным в пятне обзора, однократно и многократно рассеянным излучением в атмосфере, а также переотраженным излучением от поверхности вне пятна обзора и зарегистрированным спутниковым прибором. Наиболее значимым по величине является отраженный от поверхности сигнал, который составляет от 70 до 90% всего сигнала в зависимости от угла падения солнечного излучения. Вторым по величине сигналом является однократно рассеянное излучение [2].
В статье [1] нами рассматривалось применение метода ЭОФ для целей восстановления общего содержания углекислого газа, когда сигналы прибора были модельными. Было показано, что при отсутствии помех разного класса, присутствующих в реальных измерениях, точность восстановления общего содержания СО2 высокая (средняя относительная погрешность = 0,032%).
Применимость разработанного подхода к решению обратной задачи восстановления общего содержания СО2 из реальных данных рассматривается в данной статье.
Сигнал ООБАТ, Вт/(м2 см &)
Полосы
поглощения
Частота, см
Рис. 1. Реально измеренные спектры отраженного солнечного излучения
Метод эмпирических ортогональных функций. Описание различных составляющих измеренного сигнала необходимо было для того, чтобы пояснить специфику подходов (метод дифференциального поглощения, метод оптимального оценивания, БОЛБ и др. [3-14]) к решению обратной задачи и предлагаемого подхода. Традиционно применяются параметрические подходы, когда измеренный сигнал (см. (1)) сравнивается с физической моделью:
Уobs=f(P,b)+£, (1)
где Др,Ь) - соответствующая физическая модель (в нашем случае это уравнение переноса излучения в атмосфере); р - искомый параметр (общее содержание СО2); Ь - мешающие параметры (например, оптические толщи водяного пара и аэрозоля); £ - ошибки измерения; у0ья - полученные измерения.
Решение относительно искомого параметра ищется из выражения невязки:
А(Р) = ||у аЬ* - /(Р,Ь)||8у +а||р - Рв||8р +р||р||
где ра - априорная оценка искомого параметра; 8у - матрица ковариации случайной ошибки измерений; а, в - параметры; 8^ - матрица ковариации ошибок априорной информации и Z - матрица сглаживания Тихонова-Туоми (&ПкЬоу-Т&люшеу). Во многих алгоритмах [6, 9-13] последний член с матрицей Z опускают.
Представим один из вариантов расчета матрицы Z:
(2 -1 ... 0^
-1 2 ... 0
Решение уравнения (2), приводит к выражению: Р
+1 = рг& + А-1(КГ Б-1 (уаь* - Г (Рг& ,Ь)) + 8- V - р в) - Zpi),
здесь К - матрица Якоби (К = Г /др), содержащая частные производные, а матрица А равна А = КТ 8-1К+ 8 — + Z.
Как видно из (3) найденное решение зависит от многих составляющих, которые определяют физическую модель, точность формирования матрицы Якоби, знание априорной информации и различного рода погрешности. Эти составляющие определяют точность решения. Сложностью решения (3) является тот аспект, что в случае сильных изменений сигнала по величине, изменения вектора Ь решение может сильно меняться (свойство некорректности), а также, при больших размерностях (сотни или тысячи точек) измеряемого сигнала, время решения (3) сильно возрастает. Это обстоятельство побудило нас исследовать возможности другого подхода, более быстрого и при этом без потери точности, который относится к классу непараметрических, а именно метод эмпирических ортогональных функций.
Для непараметрических подходов характерно сравнение измеренных сигналов и решения. Статистические или иные характеристики взаимосвязи этих элементов позволяют построить алгоритм решения обратной задачи.
Пусть имеется набор измерений У, который содержит в себе информацию об искомом параметре (общем содержании СО2 на оптической трассе формирования сигнала). Между сигналом и искомым параметром существует некоторая функциональная связь вида (1).
Принцип метода эмпирических ортогональных функций (ЭОФ) широко представлен в литературе в основном для анализа рядов наблюдений, сжатия информации, выявления закономерностей проявления физических процессов во времени и пространстве [15-19]. При решении обратных задач этот подход практически не используется.
Метод решения обратной задачи восстановления общего содержания СО2 на основе ЭОФ связан с набором типичных математических операций:
Я = ДУ (ДУ)Т, ДУ = (У -< У >), (4)
где У - измеренный (или модельный) сигнал из N точек.
И = илиТ, (5)
здесь и - матрица собственных векторов и Л - собственные значения.
Е = иДУ . (6)
Для решения обратной задачи необходимо учитывать тот факт, что сигналы связаны с общим
содержанием газов, поглощающих солнечное излучение в выбранном канале длин волн. В предположении линейной зависимости искомой величины от измеренных сигналов можно получить выражение
ДР = Р-< Р >= АЕ, (7)
где вектор А является искомым из решения системы алгебраических уравнений:
А = (ДРДРТ )-1 ДРТЕ . (8)
Решение системы линейных алгебраических уравнений (8) позволяет найти коэффициенты А и тем самым построить алгоритм для обработки данных измерений, который мы назвали базовым:
Р = АЕ+<Ро>, (9)
где Р0 - среднее, полученное на стадии расчета коэффициентов А.
Численное тестирование этого подхода на модельных данных [1], позволило выявить характерную особенность алгоритма, которая выражалась в смещении решения от точного значения. Из анализа результатов численного моделирования было обнаружено, что смещение обусловлено отсутствием учета априорной информации, например зенитного угла Солнца, в зависимости от которого меняется амплитуда сигнала.
Нами была выполнена модификация данного подхода за счет добавления априорной информации. Известно, что при спутниковом зондировании атмосферы необходимо знать положение Солнца относительно пятна наблюдения. Область атмосферы над пятном наблюдения зависит от рельефа и
типов поверхности, содержания аэрозольной составляющей и распределения влажности воздуха. Учет этих компонент в матрице измерений У позволил избежать смещения решения и получить более точное решение. Все выполняемые действия, связанные с решением обратной задачи, были воплощены в программный комплекс.
Описание программного комплекса. Блок-схема программного комплекса приведена на рис. 2. Особенностью непараметрических подходов обработки является обязательное выполнение двух этапов: 1) обучения и 2) обработки. Впоследствии, когда обучение было произведено, остается один этап - обработка. На этапе обучения были использованы разнообразные наборы данных (модельные и реальные). Модельные спутниковые сигналы рассчитываются на основе программы, написанной нами [20]. Программа позволяет рассчитывать спутниковый сигнал для любой точки поверхности Земли и времени в течение года (это время циклов изменения концентрации СО2, СН4 и других атмосферных газов). Далее выбиралась точка на поверхности Земли, для которой проводились расчеты спутниковых сигналов ООБЛТ (см. рис. 1) для нескольких лет (2009-2013 гг.), с шагом 6 ч (1460 сигналов в год и каждый сигнал 8000 спектральных точек в диапазоне второго канала). Часть сигналов из общей выборки формирует обучающую выборку (50%), другая часть тестовую (50%) по правилу, представленному в [21]. Соотношение между обучающей и тестовой выборкой может быть изменено в зависимости от точности обучения на первом шаге. Если заданная точность 0,1% не достигнута, обучающая выборка увеличивается (в нашем случае на 5%) и т.д., пока не будет достигнута заданная точность. Есть ограничение на соотношение между обучающей и тестовой выборками, которое выражается в условии, что тестовая выборка не может быть менее 10% от общей выборки. В работе [1] нами были представлены результаты обучения и обработки модельных данных, которые показали результат, достаточный для того, чтобы перейти к обработке реальных сигналов. Реальные сигналы для общей выборки, для того же промежутка времени и географической точки, для уровня Ь1Б (сигналы после радиометрической калибровки) были получены на сайте [www.gosat.nies.go.jp].
Для расчета спутниковых сигналов использовалась модельная информация об общем содержании СО2 в атмосфере, а также реальные данные ООБЛТ, уровня Ь2, восстановленные из сигналов вОБЛТ значения общего содержания параметрическим методом (3)). Спутниковые сигналы и данные общего содержания являются основой для обучения, при котором формируются коэффициенты обратной задачи А и Е в нами разработанном программном комплексе (см. рис. 2).
Рис. 2. Блок-схема программного комплекса
Таким образом, процесс обучения связан с расчетами по формулам (4)-(8), а процесс обработки в использовании формулы (7), где матрица Е связана с измеренным сигналом. Более детально алгоритм представлен в [1].
После того как обработаны сигналы и получены значения общего содержания СО2, эти значения сравниваются с известными значениями, которые были известны априори при получении модельных сигналов или получены для того же времени, географического места независимым прибором.
Результаты решения обратной задачи для реальных данных. Точность определения газового состава атмосферы по данным спутниковых измерений обусловлена совокупностью разнообразных факторов: погрешность измерений прибора, абсолютная и спектральная калибровка, погрешности телеметрии, особенности алгоритма интерпретации, исходная спектроскопическая и априорная информация. Практическое использование данных о состоянии атмосферы возможно после тщательного анализа их соответствия предъявляемым требованиям точности, пространственного и временного разрешения, на основе интенсивных согласованных исследований по валидации спутниковых данных.
Для целей проверки возможности применения метода эмпирических ортогональных функций при обработке реальных сигналов нами были использованы данные измерений международной сети станций TCCON (Total Carbon Column Observing Network) [http://www.tccon.caltech.edu]. На этих станциях проводится измерение общего содержания СО2 и СН4 и других атмосферных параметров. При этом общее содержание СО2 и СН4 проводится прибором (Фурье-спектрометр среднего разрешения), по своим возможностям близком к прибору, который установлен на спутнике.
Для подготовки выборки данных, нами была выбрана станция Lamont (36.604 С, 97,486 В), находящаяся практически в центре Северной Америки. Данные станции в течение практически каждого дня (исключение составляют облачные дни, когда измерения не выполняются) были получены для временного интервала 2000-2013 гг. Спутниковые измерения были собраны за этот же промежуток времени из области размером 2x2 градуса, с центром в точке стояния станции Lamont. Всего было получено 5785 сигналов. Далее нами было выполнено согласование данных измерений GOSAT с данными измерений на станции Lamont по времени.
Каждый сигнал GOSAT представляет собой набор спектральных точек, получаемых Фурье-спектрометром в четырех каналах (около 20 тыс. точек), записанных в формате HDF. Нами выбирались данные второго канала (около 8000 точек), из которых для обработки отбирались данные (1800 точек), в которых расположены полосы поглощения углекислого газа (см. рис. 1). Далее все оставшиеся спектральные точки сигналов за весь временной промежуток времени, проходили оценку на вариабельность. Для дальнейшей работы были оставлены наиболее изменчивые по величине спектральные точки сигнала, которых осталось всего 780. Таким образом, для обучения и тестирования нами было получено для станции Lamont 5785 реальных сигналов GOSAT, в каждом из которых было 780 спектральных точек.
Для проверки работоспособности алгоритма ЭОФ нами выполнялось два варианта решения обратной задачи. Первый вариант связан с обучением и обработкой данных GOSAT для выборки в течение одного года, а второй вариант - когда обучение остается первоначальным, а выборка для обработки поступает полностью (за 2009-2013 гг.).
После обучения и решения обратной задачи стандартным подходом ЭОФ, для тестовой выборки результаты восстановленного общего содержания СО2 сравнивались со значениями для станции Lamont, которые показаны на рис. 3. Такая же процедура выполнялась для модифицированного подхода ЭОФ, когда матрица измерений дополнялась априорными значениями (зенитный угол Солнца, при котором получен сигнал, общее содержание аэрозольной составляющей атмосферы и водяного пара, на основе данных GOSAT уровня L2), и показана на рис. 4.
Рис. 3. Результаты сравнения обработки измерений в08АТ методом ЭОФ стандартным подходом
[на основе формул (4)-(7)]
Сравнение результатов, представленных на рис. 3, а, б и 4, а, б, показывает, что учет априорной информации позволяет получить более близкую информацию об общем содержании СО2 к данным измерений на наземной станции. В первом случае (см. рис. 3, б) отличие сигналов не превышает
Є с-с. .
и S- ■ (N !
Модифицированным
метод ЭОФ________
.7.7. ш
Рис. 4. Результаты сравнения обработки измерений в08ЛТ методом ЭОФ модифицированным подходом (в матрице измерений добавлена априорная информация)
Далее нами была проведена обработка всей совокупности данных (рис. 5) за несколько лет модифицированным методом ЭОФ, и результаты представлены на рис. 6, а, б.
Рис. 5. Значения общего содержания СО2 для полной выборки ТССОМ за 2009-2012 гг.
Из рис. 6 видно, что даже при обучении метода ЭОФ на выборке для одного года использование полученных на этой стадии коэффициентов [А, Е, см. (9)] для обработки результатов измерений за четыре года отличается от данных наземного измерения общего содержания СО2 с отклонением не более 0,7%. Таким образом, отклонение практически не выросло (см. рис. 3 и 4), что говорит об устойчивости и эффективности метода ЭОФ. Данное свойство хорошо объясняется тем, что метод ЭОФ основан на учете статистической информации.
Модифицированный
Общее содержание СО2 GOSAT, ррш
Рис. 6. Результаты сравнения обработки измерений в08ЛТ методом ЭОФ модифицированным подходом (в матрице измерений добавлена априорная информация)
Заключение. Проведенные исследования показывают возможность восстановления общего содержания СО2 по космическим гиперспектральным измерениям отраженного солнечного излучения при решении задач мониторинга окружающей среды. Рассмотренный метод эмпирических ортогональных функций обработки данных измерений может быть применен для получения достоверной информации о пространственно-временном поведении углекислого газа на больших территориях. Основанием для этого является согласование, с отклонением не более одного процента, данных восстановленных значений общего содержания СО2 и данных подспутниковой станции TCCON Lamont за длительный промежуток времени. Представлено описание программной системы для хранения и обработки данных, получаемых с спутника GOSAT.
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта №13-05-01036.
Катаев Михаил Юрьевич
Д-р техн. наук, профессор каф. автоматизированных систем управления (АСУ) ТУСУРа, профессор Юргинского технологического института (филиала)
Национального исследовательского Томского политехнического университета Тел.: 8-960-975-2785, (382-2) 70-15-36 Эл. почта: kataev.m@sibmail.com
Лукьянов Андрей Кириллович
Аспирант каф. Асу ТУСУРа Тел.: 8 (382-2) 70-15-36
Kataev M.Yu., Lukyanov A.K.
Retrieving of the total carbon dioxide by using an empirical orthogonal functions from satellite data
The article describes the method of empirical orthogonal functions and its modifications for the solution of recovery tasks of the total content of carbon dioxide in the real measured from satellite instrument GOSAT. The results of data processing model calculations of spectra of reflected from the surface solar radiation in the near infrared spectral range, as well as real satellite data for the station Lamont terrestrial network TCCON. Keywords: Earth&s atmosphere, gas composition, remote satellite methods, reflected from the surface solar radiation, Fourier spectrometer, empirical orthogonal functions.