Кто сказал, что вам не нужна алгебра / статистика? - Гитарист
0 голосов
/ 08 марта 2009
Для тех, кто думает, что вы никогда больше не будете использовать школьную алгебру или статистику. , , , Что же, может быть . , в зависимости от вашей работы.

Но на прошлой неделе мне нужно было узнать, как преобразовать функцию вероятности треугольного распределения в интегральную функцию вероятности.

Я был готов вывести ее из первые принципы (и могли бы иметь). Однако быстрый поиск в Google нашел то, что мне было нужно в Википедии:

http://en.wikipedia.org/wiki/Triangular_distribution

Пришлось всего лишь немного алгебры, чтобы преобразовать функцию CDF ( кумулятивная функция распределения) как функция x в обратное: то есть для любого заданного CDF вычислите значение x.

Кстати, поиск немного дальше на самом деле оказался тем способом, которым вы получили бы это из Первые принципы:

http://info.wlu.ca/~wwwsbe/faculty/amarshal/TriDist.pdf

Ответы [ 8 ]

0 голосов
/ 09 марта 2009
я действительно должен был применить свою алгебру средней школы после того, как начал работать. я учился на GMAT .....


ну, вы знаете, в день Excel, Википедии и многих онлайн-программ, которые автоматически делают много вещей для вас ... жизнь намного проще :)
0 голосов
/ 09 марта 2009
Цитата:
Первоначально написал 12Stringer
Is It можно собрать больше данных или, в лучшем случае, это просто обоснованное предположение.
Мы проводим оценку скважин, но они дороги. 150 миллионов долларов каждый - это разумная оценка.

Но типичная площадь потенциального поля может составлять порядка 6 миль х 6 миль, или 23 000 акров, или примерно один миллиард квадратных футов. Они должны быть потенциально настолько большими прямо сейчас, чтобы иметь возможность развиваться экономически. То есть предельный размер поля не обязательно должен быть таким большим, но он должен иметь потенциал, чтобы быть таким большим.

Каждая скважина, которую мы пробурим, видит только около 1 квадратного фута потенциального потенциала. площадь. Некоторые инструменты каротажа, которые мы используем в скважинах, могут позволить нам увидеть что-то около 20 квадратных футов усредненных данных.

На типичном месторождении мы могли пробурить 4 или 5 общих оценочных скважин, прежде чем принимать решение о разработке. Итак, вы можете видеть, что мы вынуждены в значительной степени полагаться на интерполяцию между скважинами и экстраполяцию за их пределами.

К счастью, у нас также есть сейсмические данные, которые немного дешевле, чем бурение скважины. Мы будем снимать и обрабатывать как минимум одну сейсмическую съемку до бурения разведочной скважины. И, как правило, будет проходить и обрабатывать еще несколько сейсмических исследований, прежде чем принимать решение о разработке.

Но, учитывая глубину этих полей (обычно 30 000 футов ниже уровня моря), и другие факторы (например, несколько тысяч футов соли выше потенциального резервуара), которые снижают качество данных, они не настолько качественны, как хотелось бы. Это не то же самое, что, например, сейсмические данные, которые мы можем получить в открытом море на относительно мелкой воде (скажем, 600 футов или меньше) и на более мелких потенциальных полях (обычно менее 10000 футов).
0 голосов
/ 09 марта 2009
Кстати, использование преобразованной функции накопительного распределения работает как шарм. , по крайней мере, в Excel / Crystal Ball.

Я запустил симуляцию двумя способами:

1) Все 56 неопределенностей определены как отдельные треугольные распределения в Crystal Ball, причем все они полностью зависимы.

2) Только одно распределение (равномерное распределение между 0 и 1) со всеми 56 неопределенностями, теперь выраженными в виде функции CDF на основе этого единственного случайного числа.

Когда я запускаю симуляции (10 000 испытания, с выборкой из латинского гиперкуба), я получаю те же результаты.

Итак, я проверил, что теперь мы можем сделать это.

К сожалению, мой сотрудник попытался закодировать это в "интерфейсную часть" неопределенности для нашего симулятора и не пока не везет. Возможно, он допустил ошибку в кодировании (я думаю, что синтаксис - PERL, с которым я не настолько знаком, я думаю, он немного).

Но отчасти это может быть проблемой с неопределенностью "переднего конца" для симулятора. Например, он сказал мне, что когда он использует равномерный дистрибутив в этой программе, он хочет не только минимум и максимум, но и наиболее вероятный. Там нет наиболее вероятного с равномерным распределением. Все значения одинаково вероятны.

Итак, теперь нам нужно копать дальше.
0 голосов
/ 09 марта 2009
Возможно ли собрать больше данных или это в лучшем случае просто обоснованное предположение. Я понимаю, почему вы используете программу под названием хрустальный шар. Чем больше данных вы выберете, тем больше вероятность того, что удастся получить хороший депозит.
0 голосов
/ 08 марта 2009
Цитата:
Сообщение от jwenting
статистика просто еще одно слово для того, чтобы данные выглядели так, как будто они поддерживают мнение людей, которые платят вам ...
К счастью, в нашем случае люди, платящие нам, хотят, чтобы наши "экспертные мнения «о том, каковы возможные результаты для потенциальных разработок нефтяных месторождений. И хотя они бы предпочли получить «хорошие новости» от нас, они бы предпочли иметь наши честные мнения. Почему? Поскольку эти проекты, над которыми мы работаем в сверхглубоких водах Мексиканского залива (скажем, в среднем на глубине 7500 футов), могут стоить КАЖДОЙ разработки на миллиарды долларов. Это может буквально «создать или разрушить» нашу компанию.

Данные, которыми мы располагаем, на самом деле весьма ограничены и могут быть интерпретированы такими людьми, как мы. Таким образом, вместо того, чтобы давать только один «наиболее вероятный» или «лучший догадка» ответ, нам действительно нужно давать руководству возможные РЕЙДИНГИ из результатов. Как правило, в итоге мы даем то, что мы называем «минимальным» ответом (более чем на 90% вероятность того, что ответ больше, чем то, что мы называем минимальным), и «максимальным» ответом (только на 10% вероятность, что ответ больше, чем то, что мы называем максимум) и ответ «P50» (равный шанс того, что ответ будет меньше или больше, чем то, что мы называем P50).

Однако дело в том, какой ответ мы ищем (в конечном счете, прибыльность разработка нефтяного месторождения) состоит из множества разных вещей. Вещи как:

Сколько нефти на месте?
Сколько нефти на месте мы будем добывать?
При каких темпах / графике добычи мы будем добывать нефть?
Как Сколько скважин потребуется для извлечения указанной нефти?
Сколько будет стоить каждая скважина и как долго их бурить / заканчивать?
Сколько будет стоить строительство плавучей конструкции и трубопроводов для добычи скважин?

И каждый из этих вопросов, в свою очередь, зависит от нескольких параметров, которые мы знаем только с различной степенью неопределенности.

Ситуация усложняется тем, что многие переменные в некоторой степени зависят от другие переменные (буквально от полностью зависимых до полностью независимых). Таким образом, правильная обработка всего этого является ключом к получению ответа, который правильно отражает нашу общую степень неопределенности.

Да, мне буквально платят, чтобы сообщить руководству, как мало мы на самом деле знаем. :)))
0 голосов
/ 08 марта 2009
Цитата:
Сообщение от 12Stringer
Ух ты на самом деле нашел применение для этого?
Да, конечно. Главным образом потому, что некоторые из наших программ, в которых мы хотим использовать статистические методы для изучения различных возможных результатов разработки нефтяного месторождения, не настолько надежны, как следовало бы.

Я использовал надстройку Excel, которая называлась Хрустальный шар, чтобы сделать некоторые основные статистические манипуляции. С этой программой очень легко сделать так, чтобы несколько переменных (описанных с треугольными распределениями) зависели друг от друга.

Однако надстройка, которую мы используем для нашего симулятора пласта, предполагает, что все переменные полностью независимы. Нам нужен был способ правильно сделать определенные переменные зависимыми в этой надстройке моделирования пласта.

Способ сделать это - взять треугольное распределение частот (где мы оцениваем минимальные, максимальные и наиболее вероятные значения ... a, b и c)

image

и затем превращаем это в совокупное распределение вероятностей

image

Тогда то, что вы делаете, это поворачиваете последний график на его другую ось, где CDF находится на горизонтальной оси x, а переменная x (между значениями a и c) теперь находится на оси y. Вы делаете это для всех переменных, которые хотите, чтобы они были полностью зависимыми.

Теперь вам нужно сгенерировать равномерно случайную переменную (от 0 до 1), а затем использовать эту переменную для поиска значения по каждой из зависимая переменная на графиках «перевернутого кумулятивного распределения вероятностей». Это обеспечивает зависимость между этими переменными.

PDF-файл, на который я ссылался, немного обсуждает, как это работает с одной переменной. Однако это не касается зависимости нескольких переменных.

Однако действительно необходимо, чтобы наша надстройка для симуляции пласта была намного более надежной и гибкой. Сорта, как Хрустальный шар, в Excel. Но мы должны работать с тем, что у нас есть.
0 голосов
/ 08 марта 2009
статистика - это еще одно слово для того, чтобы данные выглядели так, как будто они поддерживают мнение людей, платящих вам ...
0 голосов
/ 08 марта 2009
Ух ты на самом деле нашел применение для этого? Прошло 20 лет с тех пор, как я применил любую алгебру этого комплекса. Это вернуло воспоминания о старшей школе. Я был Math Geek.
Добро пожаловать на сайт Гитарист, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...