Czy praktyczna reguła „Unikaj używania zmiennoprzecinkowych” ma zastosowanie do mikrokontrolera z jednostką zmiennoprzecinkową (FPU)?

gberth

2020-04-16 20:07:45 UTC

view on stackexchange narkive permalink

Zasadą jest, że staram się unikać używania liczb zmiennoprzecinkowych w mojej bazie kodu wbudowanego systemu.

Zmienne zmiennoprzecinkowe to:

Wymagające dużej mocy obliczeniowej
Nie atomowy (może powodować problemy w aplikacji RTOS lub z przerwaniami)
Ich precyzja może powodować nieoczywiste zachowanie (problem z porównaniem typu float).

Ale co z mikrokontrolerem z jednostką zmiennoprzecinkową (jak STM32F4)?

Czy te obawy nadal mają zastosowanie?Czy nadal odradzałbyś używanie zmiennoprzecinkowych?

Punkty (2) i (3) nadal obowiązują.Więc nie tyle „unikaj całkowicie”, ale „używaj z otwartymi oczami”, aby uniknąć problemów z atomowością lub zawodnymi operacjami.(I nigdy nie używaj liczb zmiennoprzecinkowych jako zmiennych pętli!)

Należy wybrać MCU, aby pasował do aplikacji, zamiast projektować aplikację tak, aby pasowała do MCU.Jeśli więc możesz uniknąć operacji zmiennoprzecinkowych, możesz wybrać MCU bez FPU i prawdopodobnie obniżyć koszt swojego systemu.

@ThePhoton W przypadku STM jest to szczególnie prawdziwe, ponieważ wiele serii F1-F4 jest kompatybilnych z pinami

`_Atomic float` działa podobnie do` _Atomic int32_t`, jeśli chodzi o atomowość i porządkowanie, i działa bez blokad na zwykłych procesorach ARM.Jeśli myślisz, że zwykłe „int” jest ogólnie bezpieczne w użyciu w C, pomyśl jeszcze raz.na przykład[Programowanie MCU - optymalizacja C ++ O2 przerywa pracę w pętli] (https://electronics.stackexchange.com/a/387478).Re: atomic zmiennoprzecinkowe - obsługa kompilatora / języka jest w zasadzie taka sama jak w C ++: [Atomic double zmiennoprzecinkowy lub SSE / AVX vector load / store on x86 \ _64] (https://stackoverflow.com/q/45055402) /[C ++ 20 std :: atomic- std :: atomic.specializations] (https://stackoverflow.com/q/58680928)

Operacje na liczbach całkowitych * nie * są niepodzielne bez wyraźnych zabezpieczeń, które je tak spowodowały.Nie dzieje się to automatycznie.To sprawia, że druga uwaga jest nieważna i nie ma zastosowania.Pierwsza uwaga nie ma zastosowania, jeśli masz sprzętową jednostkę FPU.Więc patrzysz tylko na trzecią kwestię: precyzję.Jeśli potrzebujesz liczb zmiennoprzecinkowych, potrzebujesz zmiennoprzecinkowych.Nie ma to nic wspólnego z MCU.Programiści na dużych maszynach żelaznych podejmują te same decyzje z takimi samymi kompromisami w odniesieniu do precyzji.

@CodyGray: Trochę więcej myślałem o tym „nieatomowym” twierdzeniu.Zastanawiam się, czy ludzie mają na myśli, że niektóre biblioteki soft-float nie są ponownie wprowadzane, a zatem mogą się zepsuć, jeśli w trakcie obliczeń nastąpi przerwanie, nawet bez dostępu do pamięci współdzielonej (jeśli programy obsługi przerwań również używają FP lub przełączasz kontekst)?Miałoby to jakiś sens (w przypadkach / ISA, w których nie można po prostu używać miejsca na stosie dla tymczasowych, albo jest zbyt duże, albo nie ma wygodnego adresowania względnego stosu w starych 8-bitowych mikrometrach).Jeśli tak, nie jest to jasny sposób, aby to opisać, zwłaszcza w języku C.

„Może powodować nieoczywiste zachowanie” - nie jest to powód, aby nie używać pływaków, ale właściwie _uczyć się_ o ich zachowaniu.W wielu zastosowaniach pływaki _ są_ najlepiej dopasowane, jeśli możesz sobie na nie pozwolić.Stała precyzja daje po prostu kolejny zestaw nieoczywistych zachowań, które w praktycznych zastosowaniach są często znacznie gorsze.

Musisz spojrzeć na szczegółowe informacje o czasie.Nawet przy przyspieszonej FPU możesz nie mieć pojedynczego cyklu zegara mnożyć i dzielić.Zoptymalizowane obliczenia liczb całkowitych mogą nadal być szybsze i na pewno będą bardziej przenośne na tańszy sprzęt.Ale jeśli procesor jest już wybrany, majstrowanie przy procedurach całkowitych może nie mieć sensu.

@CodyGray: Większość platform oferuje gwarancje dotyczące efektów jednoczesnych operacji, które są silniejsze niż to, co wymagałoby większość języków programowania.Na przykład większość platform 32-bitowych nie wymaga, aby programiści robili nic specjalnego w celu odczytania wyrównanego 32-bitowego obiektu w sposób gwarantujący albo zwrócenie jego wartości początkowej, albo jakiejś 32-bitowej wartości, która została do niego zapisana odwtedy i gwarantujemy, że jeśli obiekt jest zapisywany tylko przez jeden wątek, a inny wątek obserwuje skutki zapisu, wszystkie przyszłe obserwacje dadzą tę wartość lub wartości zapisane po nim.

@supercat Problem z tym, że liczby całkowite / zmiennoprzecinkowe itp. Nie są atomowe, nie jest tak bardzo w sprzęcie, jak w języku C.Na przykład C uwielbia używać stosu, więc jeśli czytasz jakąś 32-bitową liczbę całkowitą za pomocą 32-bitowego procesora, może to nadal oznaczać „załaduj rejestr x ze stosu” + „odczyt rejestru x”, czyli 2 instrukcje asemblera, a nie atomowe, niezależnie od tego, czy procesor jest w stanie wykonać atomową instrukcję odczytu rejestru x, czy nie.Jeśli piszesz wszystko w asemblerze, to nie masz tego problemu, ale obecnie niewiele osób to robi.

@Lundin: Zaniedbałem scenariusz, w którym obserwacje obiektu mogą podróżować w czasie, co mogłoby wystąpić, gdyby wątek 1 czyta obiekt przez jedną lwartość, potem inną lwartość i ponownie przez pierwszą, ponowne użycie pierwszej lwartości może daćwartość odczytana wcześniej.Mea culpa o tym.Z drugiej strony myślę, że większość implementacji dla większości platform musiałaby zrobić wszystko, co w ich mocy, aby nie dotrzymać pierwszej gwarancji - że każdy odczyt da albo wartość początkową obiektu, albo jakąś wartość, która została zapisana od tamtej pory,i najogólniej powstrzymać się od takich rzeczy.

@Lundin: Szkoda, że standard języka nie zapewnia środków, dzięki którym implementacja może otrzymać „zwykły” wskaźnik do obiektu i odczytać go z dowolną zdefiniowaną semantyką w scenariuszach, w których można uzyskać do niego dostęp gdzie indziej, nawet jeśli jest stary lub nowywartości byłyby akceptowalne (nowsze prawdopodobnie preferowane, ale stare nadal tolerowane).

@supercat Bardzo ważnym scenariuszem jest: - main.c ładuje wartość rejestru z "PORTX" do rejestru procesora.- Zmiana kontekstu z ISR.- ISR zapisuje do PORTX i zwraca.- main.c zapisuje dane z rejestru procesora do PORTX i niszczy wszystko, co ISR właśnie tam zrobił.

@Lundin: Oczywiście.Jeśli kod wymaga niezawodnej atomowej sekwencji odczytu-modyfikacji-zapisu, należy napisać kod, aby ją wymusić.Jedną z moich ulubionych rzeczy jest sprzęt, który sprawia, że takie rzeczy są konieczne, zamiast używania oddzielnych adresów „set-bit” i „clear-bit”.Z drugiej strony, bardzo słaba semantyka, jak opisałem, byłaby wystarczająca do obsługi wzorca leniwego-niezmiennego-singletona z zerowym narzutem komunikacyjnym CPU, jeśli ktoś jest skłonny tolerować jedno wystąpienie wycieku na rdzeń na okres życia aplikacji.Każdy rdzeń, który odczytuje wskaźnik singletona, zobaczy wskaźnik zerowy lub ...

... adres zainicjowanej instancji (zakładając, że kod, który generuje instancję, zawiera barierę między utworzeniem singletona a publikacją jej adresu, a menedżer pamięci oferuje sposób zażądania bloku pamięci, który jest gwarantowanynie znajdować się w niczyjej pamięci podręcznej).

Biorąc pod uwagę zmienną uin32_t na jednordzeniowym, wielozadaniowym, 32-bitowym MCU (np. STM32 z RTOS).Biorąc również pod uwagę, że dwa zadania mają dostęp do tego adresu pamięci uint32_t, pierwsze jako czytnik, drugie jako pisarz. Według mojego zrozumienia, nawet przy niefortunnym przełączeniu kontekstu RTOS, stan wyścigu nie jest możliwy.Zgodziłbyś się? Tak (być może omyłkowo) zdefiniowałem atomic. Czy Twoja definicja atomic: Operation jest wykonywana w jednej instrukcji (więc nawet ISR nie może wygenerować warunku wyścigu)?Jeśli tak, czy można mieć zmienną atomową w systemie wbudowanym?