Compare commits
No commits in common. "a3f41fd4d925e8da2a13ec7de7c15afadbfa302c" and "988f7b05615c86532cceb584c0c3990a2e417e4c" have entirely different histories.
a3f41fd4d9
...
988f7b0561
|
@ -1,18 +1,18 @@
|
||||||
#pragma once
|
#pragma once
|
||||||
|
|
||||||
#include <BAN/Limits.h>
|
#include <BAN/Limits.h>
|
||||||
#include <BAN/Numbers.h>
|
|
||||||
#include <BAN/Traits.h>
|
#include <BAN/Traits.h>
|
||||||
|
|
||||||
#include <float.h>
|
#include <stddef.h>
|
||||||
|
#include <stdint.h>
|
||||||
|
|
||||||
namespace BAN::Math
|
namespace BAN::Math
|
||||||
{
|
{
|
||||||
|
|
||||||
template<typename T>
|
template<typename T>
|
||||||
inline constexpr T abs(T x)
|
inline constexpr T abs(T val)
|
||||||
{
|
{
|
||||||
return x < 0 ? -x : x;
|
return val < 0 ? -val : val;
|
||||||
}
|
}
|
||||||
|
|
||||||
template<typename T>
|
template<typename T>
|
||||||
|
@ -59,11 +59,11 @@ namespace BAN::Math
|
||||||
}
|
}
|
||||||
|
|
||||||
template<integral T>
|
template<integral T>
|
||||||
inline constexpr bool is_power_of_two(T x)
|
inline constexpr bool is_power_of_two(T value)
|
||||||
{
|
{
|
||||||
if (x == 0)
|
if (value == 0)
|
||||||
return false;
|
return false;
|
||||||
return (x & (x - 1)) == 0;
|
return (value & (value - 1)) == 0;
|
||||||
}
|
}
|
||||||
|
|
||||||
template<BAN::integral T>
|
template<BAN::integral T>
|
||||||
|
@ -89,181 +89,43 @@ namespace BAN::Math
|
||||||
|
|
||||||
template<typename T>
|
template<typename T>
|
||||||
requires is_same_v<T, unsigned int> || is_same_v<T, unsigned long> || is_same_v<T, unsigned long long>
|
requires is_same_v<T, unsigned int> || is_same_v<T, unsigned long> || is_same_v<T, unsigned long long>
|
||||||
inline constexpr T ilog2(T x)
|
inline constexpr T ilog2(T value)
|
||||||
{
|
{
|
||||||
if constexpr(is_same_v<T, unsigned int>)
|
if constexpr(is_same_v<T, unsigned int>)
|
||||||
return sizeof(T) * 8 - __builtin_clz(x) - 1;
|
return sizeof(T) * 8 - __builtin_clz(value) - 1;
|
||||||
if constexpr(is_same_v<T, unsigned long>)
|
if constexpr(is_same_v<T, unsigned long>)
|
||||||
return sizeof(T) * 8 - __builtin_clzl(x) - 1;
|
return sizeof(T) * 8 - __builtin_clzl(value) - 1;
|
||||||
return sizeof(T) * 8 - __builtin_clzll(x) - 1;
|
return sizeof(T) * 8 - __builtin_clzll(value) - 1;
|
||||||
}
|
}
|
||||||
|
|
||||||
template<floating_point T>
|
template<floating_point T>
|
||||||
inline constexpr T floor(T x)
|
inline constexpr T log2(T value)
|
||||||
{
|
{
|
||||||
if constexpr(is_same_v<T, float>)
|
T result;
|
||||||
return __builtin_floorf(x);
|
asm volatile("fyl2x" : "=t"(result) : "0"(value), "u"((T)1.0) : "st(1)");
|
||||||
if constexpr(is_same_v<T, double>)
|
return result;
|
||||||
return __builtin_floor(x);
|
|
||||||
if constexpr(is_same_v<T, long double>)
|
|
||||||
return __builtin_floorl(x);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
template<floating_point T>
|
template<floating_point T>
|
||||||
inline constexpr T ceil(T x)
|
inline constexpr T log10(T value)
|
||||||
{
|
{
|
||||||
if constexpr(is_same_v<T, float>)
|
constexpr T INV_LOG_2_10 = 0.3010299956639811952137388947244930267681898814621085413104274611;
|
||||||
return __builtin_ceilf(x);
|
T result;
|
||||||
if constexpr(is_same_v<T, double>)
|
asm volatile("fyl2x" : "=t"(result) : "0"(value), "u"(INV_LOG_2_10) : "st(1)");
|
||||||
return __builtin_ceil(x);
|
return result;
|
||||||
if constexpr(is_same_v<T, long double>)
|
|
||||||
return __builtin_ceill(x);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
template<floating_point T>
|
template<floating_point T>
|
||||||
inline constexpr T round(T x)
|
inline constexpr T log(T value, T base)
|
||||||
{
|
{
|
||||||
if (x == (T)0.0)
|
return log2(value) / log2(base);
|
||||||
return x;
|
|
||||||
if (x > (T)0.0)
|
|
||||||
return floor<T>(x + (T)0.5);
|
|
||||||
return ceil<T>(x - (T)0.5);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
template<floating_point T>
|
template<floating_point T>
|
||||||
inline constexpr T trunc(T x)
|
inline constexpr T pow(T base, T exp)
|
||||||
{
|
{
|
||||||
if constexpr(is_same_v<T, float>)
|
T result;
|
||||||
return __builtin_truncf(x);
|
asm volatile(
|
||||||
if constexpr(is_same_v<T, double>)
|
|
||||||
return __builtin_trunc(x);
|
|
||||||
if constexpr(is_same_v<T, long double>)
|
|
||||||
return __builtin_truncl(x);
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T rint(T x)
|
|
||||||
{
|
|
||||||
asm("frndint" : "+t"(x));
|
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T fmod(T a, T b)
|
|
||||||
{
|
|
||||||
asm(
|
|
||||||
"1:"
|
|
||||||
"fprem;"
|
|
||||||
"fnstsw %%ax;"
|
|
||||||
"testb $4, %%ah;"
|
|
||||||
"jne 1b;"
|
|
||||||
: "+t"(a)
|
|
||||||
: "u"(b)
|
|
||||||
: "ax"
|
|
||||||
);
|
|
||||||
return a;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
static T modf(T x, T* iptr)
|
|
||||||
{
|
|
||||||
const T frac = BAN::Math::fmod<T>(x, 1);
|
|
||||||
*iptr = x - frac;
|
|
||||||
return frac;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T frexp(T num, int* exp)
|
|
||||||
{
|
|
||||||
if (num == 0.0)
|
|
||||||
{
|
|
||||||
*exp = 0;
|
|
||||||
return 0.0;
|
|
||||||
}
|
|
||||||
|
|
||||||
T _exp;
|
|
||||||
asm("fxtract" : "+t"(num), "=u"(_exp));
|
|
||||||
*exp = (int)_exp + 1;
|
|
||||||
return num / (T)2.0;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T copysign(T x, T y)
|
|
||||||
{
|
|
||||||
if ((x < (T)0.0) != (y < (T)0.0))
|
|
||||||
x = -x;
|
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
namespace detail
|
|
||||||
{
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T fyl2x(T x, T y)
|
|
||||||
{
|
|
||||||
asm("fyl2x" : "+t"(x) : "u"(y) : "st(1)");
|
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T log(T x)
|
|
||||||
{
|
|
||||||
return detail::fyl2x<T>(x, numbers::ln2_v<T>);
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T log2(T x)
|
|
||||||
{
|
|
||||||
return detail::fyl2x<T>(x, 1.0);
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T log10(T x)
|
|
||||||
{
|
|
||||||
return detail::fyl2x<T>(x, numbers::lg2_v<T>);
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T logb(T x)
|
|
||||||
{
|
|
||||||
static_assert(FLT_RADIX == 2);
|
|
||||||
return log2<T>(x);
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T exp2(T x)
|
|
||||||
{
|
|
||||||
if (abs(x) <= (T)1.0)
|
|
||||||
{
|
|
||||||
asm("f2xm1" : "+t"(x));
|
|
||||||
return x + (T)1.0;
|
|
||||||
}
|
|
||||||
|
|
||||||
asm(
|
|
||||||
"fld1;"
|
|
||||||
"fld %%st(1);"
|
|
||||||
"fprem;"
|
|
||||||
"f2xm1;"
|
|
||||||
"faddp;"
|
|
||||||
"fscale;"
|
|
||||||
"fstp %%st(1);"
|
|
||||||
: "+t"(x)
|
|
||||||
);
|
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T exp(T x)
|
|
||||||
{
|
|
||||||
return exp2<T>(x * numbers::log2e_v<T>);
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T pow(T x, T y)
|
|
||||||
{
|
|
||||||
asm(
|
|
||||||
"fyl2x;"
|
"fyl2x;"
|
||||||
"fld1;"
|
"fld1;"
|
||||||
"fld %%st(1);"
|
"fld %%st(1);"
|
||||||
|
@ -271,170 +133,12 @@ namespace BAN::Math
|
||||||
"f2xm1;"
|
"f2xm1;"
|
||||||
"faddp;"
|
"faddp;"
|
||||||
"fscale;"
|
"fscale;"
|
||||||
: "+t"(x), "+u"(y)
|
"fxch %%st(1);"
|
||||||
|
"fstp %%st;"
|
||||||
|
: "=t"(result)
|
||||||
|
: "0"(base), "u"(exp)
|
||||||
);
|
);
|
||||||
|
return result;
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T scalbn(T x, int n)
|
|
||||||
{
|
|
||||||
asm("fscale" : "+t"(x) : "u"(static_cast<T>(n)));
|
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T ldexp(T x, int y)
|
|
||||||
{
|
|
||||||
const bool exp_sign = y < 0;
|
|
||||||
if (exp_sign)
|
|
||||||
y = -y;
|
|
||||||
|
|
||||||
T exp = (T)1.0;
|
|
||||||
T mult = (T)2.0;
|
|
||||||
while (y)
|
|
||||||
{
|
|
||||||
if (y & 1)
|
|
||||||
exp *= mult;
|
|
||||||
mult *= mult;
|
|
||||||
y >>= 1;
|
|
||||||
}
|
|
||||||
|
|
||||||
if (exp_sign)
|
|
||||||
exp = (T)1.0 / exp;
|
|
||||||
|
|
||||||
return x * exp;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T sqrt(T x)
|
|
||||||
{
|
|
||||||
asm("fsqrt" : "+t"(x));
|
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T cbrt(T value)
|
|
||||||
{
|
|
||||||
if (value == 0.0)
|
|
||||||
return 0.0;
|
|
||||||
return pow<T>(value, 1.0 / 3.0);
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T sin(T x)
|
|
||||||
{
|
|
||||||
x = fmod<T>(x, (T)2.0 * numbers::pi_v<T>);
|
|
||||||
asm("fsin" : "+t"(x));
|
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T cos(T x)
|
|
||||||
{
|
|
||||||
if (abs(x) >= (T)9223372036854775808.0)
|
|
||||||
x = fmod<T>(x, (T)2.0 * numbers::pi_v<T>);
|
|
||||||
asm("fcos" : "+t"(x));
|
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T tan(T x)
|
|
||||||
{
|
|
||||||
T one, ret;
|
|
||||||
asm(
|
|
||||||
"fptan"
|
|
||||||
: "=t"(one), "=u"(ret)
|
|
||||||
: "0"(x)
|
|
||||||
);
|
|
||||||
return ret;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T atan2(T y, T x)
|
|
||||||
{
|
|
||||||
asm(
|
|
||||||
"fpatan"
|
|
||||||
: "+t"(x)
|
|
||||||
: "u"(y)
|
|
||||||
: "st(1)"
|
|
||||||
);
|
|
||||||
return x;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T atan(T x)
|
|
||||||
{
|
|
||||||
return atan2<T>(x, 1.0);
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T asin(T x)
|
|
||||||
{
|
|
||||||
if (x == (T)0.0)
|
|
||||||
return (T)0.0;
|
|
||||||
if (x == (T)1.0)
|
|
||||||
return numbers::pi_v<T> / (T)2.0;
|
|
||||||
if (x == (T)-1.0)
|
|
||||||
return -numbers::pi_v<T> / (T)2.0;
|
|
||||||
return (T)2.0 * atan<T>(x / (T(1.0) + sqrt<T>((T)1.0 - x * x)));
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T acos(T x)
|
|
||||||
{
|
|
||||||
if (x == (T)0.0)
|
|
||||||
return numbers::pi_v<T> / (T)2.0;
|
|
||||||
if (x == (T)1.0)
|
|
||||||
return (T)0.0;
|
|
||||||
if (x == (T)-1.0)
|
|
||||||
return numbers::pi_v<T>;
|
|
||||||
return (T)2.0 * atan<T>(sqrt<T>((T)1.0 - x * x) / ((T)1.0 + x));
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T sinh(T x)
|
|
||||||
{
|
|
||||||
return (exp<T>(x) - exp<T>(-x)) / (T)2.0;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T cosh(T x)
|
|
||||||
{
|
|
||||||
return (exp<T>(x) + exp<T>(-x)) / (T)2.0;
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T tanh(T x)
|
|
||||||
{
|
|
||||||
const T exp_px = exp<T>(x);
|
|
||||||
const T exp_nx = exp<T>(-x);
|
|
||||||
return (exp_px - exp_nx) / (exp_px + exp_nx);
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T asinh(T x)
|
|
||||||
{
|
|
||||||
return log<T>(x + sqrt<T>(x * x + (T)1.0));
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T acosh(T x)
|
|
||||||
{
|
|
||||||
return log<T>(x + sqrt<T>(x * x - (T)1.0));
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T atanh(T x)
|
|
||||||
{
|
|
||||||
return (T)0.5 * log<T>(((T)1.0 + x) / ((T)1.0 - x));
|
|
||||||
}
|
|
||||||
|
|
||||||
template<floating_point T>
|
|
||||||
inline constexpr T hypot(T x, T y)
|
|
||||||
{
|
|
||||||
return sqrt<T>(x * x + y * y);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
}
|
}
|
||||||
|
|
|
@ -1,28 +0,0 @@
|
||||||
#pragma once
|
|
||||||
|
|
||||||
#include <BAN/Traits.h>
|
|
||||||
|
|
||||||
namespace BAN::numbers
|
|
||||||
{
|
|
||||||
|
|
||||||
template<floating_point T> inline constexpr T e_v = 2.71828182845904523536;
|
|
||||||
template<floating_point T> inline constexpr T log2e_v = 1.44269504088896340736;
|
|
||||||
template<floating_point T> inline constexpr T lge_v = 0.43429448190325182765;
|
|
||||||
template<floating_point T> inline constexpr T lg2_v = 0.30102999566398119521;
|
|
||||||
template<floating_point T> inline constexpr T ln2_v = 0.69314718055994530942;
|
|
||||||
template<floating_point T> inline constexpr T ln10_v = 2.30258509299404568402;
|
|
||||||
template<floating_point T> inline constexpr T pi_v = 3.14159265358979323846;
|
|
||||||
template<floating_point T> inline constexpr T sqrt2_v = 1.41421356237309504880;
|
|
||||||
template<floating_point T> inline constexpr T sqrt3_v = 1.73205080756887729353;
|
|
||||||
|
|
||||||
inline constexpr double e = e_v<double>;
|
|
||||||
inline constexpr double log2e = log2e_v<double>;
|
|
||||||
inline constexpr double lge = lge_v<double>;
|
|
||||||
inline constexpr double lg2 = lge_v<double>;
|
|
||||||
inline constexpr double ln2 = ln2_v<double>;
|
|
||||||
inline constexpr double ln10 = ln10_v<double>;
|
|
||||||
inline constexpr double pi = pi_v<double>;
|
|
||||||
inline constexpr double sqrt2 = sqrt2_v<double>;
|
|
||||||
inline constexpr double sqrt3 = sqrt3_v<double>;
|
|
||||||
|
|
||||||
}
|
|
|
@ -4,6 +4,8 @@ if (NOT ${CMAKE_SYSTEM_NAME} STREQUAL "banan-os")
|
||||||
message(FATAL_ERROR "CMAKE_SYSTEM_NAME is not banan-os")
|
message(FATAL_ERROR "CMAKE_SYSTEM_NAME is not banan-os")
|
||||||
endif ()
|
endif ()
|
||||||
|
|
||||||
|
set(BANAN_ENABLE_SSE 1)
|
||||||
|
|
||||||
project(banan-os CXX C ASM)
|
project(banan-os CXX C ASM)
|
||||||
|
|
||||||
set(BANAN_BASE_SYSROOT ${CMAKE_SOURCE_DIR}/base-sysroot.tar.gz)
|
set(BANAN_BASE_SYSROOT ${CMAKE_SOURCE_DIR}/base-sysroot.tar.gz)
|
||||||
|
|
|
@ -175,6 +175,7 @@ add_executable(kernel ${KERNEL_SOURCES})
|
||||||
|
|
||||||
target_compile_definitions(kernel PRIVATE __is_kernel)
|
target_compile_definitions(kernel PRIVATE __is_kernel)
|
||||||
target_compile_definitions(kernel PRIVATE __arch=${BANAN_ARCH})
|
target_compile_definitions(kernel PRIVATE __arch=${BANAN_ARCH})
|
||||||
|
target_compile_definitions(kernel PRIVATE __enable_sse=${BANAN_ENABLE_SSE})
|
||||||
|
|
||||||
target_compile_options(kernel PRIVATE
|
target_compile_options(kernel PRIVATE
|
||||||
-O2 -g
|
-O2 -g
|
||||||
|
|
|
@ -2,7 +2,6 @@
|
||||||
|
|
||||||
#include <BAN/Array.h>
|
#include <BAN/Array.h>
|
||||||
#include <BAN/ByteSpan.h>
|
#include <BAN/ByteSpan.h>
|
||||||
#include <BAN/Vector.h>
|
|
||||||
#include <kernel/Memory/Types.h>
|
#include <kernel/Memory/Types.h>
|
||||||
|
|
||||||
namespace Kernel
|
namespace Kernel
|
||||||
|
|
|
@ -86,8 +86,10 @@ namespace Kernel
|
||||||
InterruptStack& interrupt_stack() { return m_interrupt_stack; }
|
InterruptStack& interrupt_stack() { return m_interrupt_stack; }
|
||||||
InterruptRegisters& interrupt_registers() { return m_interrupt_registers; }
|
InterruptRegisters& interrupt_registers() { return m_interrupt_registers; }
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
void save_sse();
|
void save_sse();
|
||||||
void load_sse();
|
void load_sse();
|
||||||
|
#endif
|
||||||
|
|
||||||
void add_mutex() { m_mutex_count++; }
|
void add_mutex() { m_mutex_count++; }
|
||||||
void remove_mutex() { m_mutex_count--; }
|
void remove_mutex() { m_mutex_count--; }
|
||||||
|
@ -125,7 +127,9 @@ namespace Kernel
|
||||||
|
|
||||||
BAN::Atomic<uint32_t> m_mutex_count { 0 };
|
BAN::Atomic<uint32_t> m_mutex_count { 0 };
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
alignas(16) uint8_t m_sse_storage[512] {};
|
alignas(16) uint8_t m_sse_storage[512] {};
|
||||||
|
#endif
|
||||||
|
|
||||||
friend class Process;
|
friend class Process;
|
||||||
friend class Scheduler;
|
friend class Scheduler;
|
||||||
|
|
|
@ -87,7 +87,10 @@ namespace Kernel
|
||||||
while (true)
|
while (true)
|
||||||
{
|
{
|
||||||
SystemTimer::get().sleep_ms(10'000);
|
SystemTimer::get().sleep_ms(10'000);
|
||||||
s_instance->initiate_sync(false);
|
|
||||||
|
LockGuard _(s_instance->m_device_lock);
|
||||||
|
s_instance->m_should_sync = true;
|
||||||
|
s_instance->m_sync_thread_blocker.unblock();
|
||||||
}
|
}
|
||||||
}, nullptr, sync_process
|
}, nullptr, sync_process
|
||||||
)));
|
)));
|
||||||
|
|
|
@ -182,7 +182,9 @@ namespace Kernel
|
||||||
if (tid)
|
if (tid)
|
||||||
{
|
{
|
||||||
auto& thread = Thread::current();
|
auto& thread = Thread::current();
|
||||||
|
#if __enable_sse
|
||||||
thread.save_sse();
|
thread.save_sse();
|
||||||
|
#endif
|
||||||
|
|
||||||
if (isr == ISR::PageFault && Thread::current().is_userspace())
|
if (isr == ISR::PageFault && Thread::current().is_userspace())
|
||||||
{
|
{
|
||||||
|
@ -316,8 +318,12 @@ namespace Kernel
|
||||||
|
|
||||||
ASSERT(Thread::current().state() != Thread::State::Terminated);
|
ASSERT(Thread::current().state() != Thread::State::Terminated);
|
||||||
|
|
||||||
done:
|
done:
|
||||||
|
#if __enable_sse
|
||||||
Thread::current().load_sse();
|
Thread::current().load_sse();
|
||||||
|
#else
|
||||||
|
return;
|
||||||
|
#endif
|
||||||
}
|
}
|
||||||
|
|
||||||
extern "C" void cpp_yield_handler(InterruptStack* interrupt_stack, InterruptRegisters* interrupt_registers)
|
extern "C" void cpp_yield_handler(InterruptStack* interrupt_stack, InterruptRegisters* interrupt_registers)
|
||||||
|
@ -370,7 +376,9 @@ namespace Kernel
|
||||||
asm volatile("cli; 1: hlt; jmp 1b");
|
asm volatile("cli; 1: hlt; jmp 1b");
|
||||||
}
|
}
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
Thread::current().save_sse();
|
Thread::current().save_sse();
|
||||||
|
#endif
|
||||||
|
|
||||||
if (!InterruptController::get().is_in_service(irq))
|
if (!InterruptController::get().is_in_service(irq))
|
||||||
dprintln("spurious irq 0x{2H}", irq);
|
dprintln("spurious irq 0x{2H}", irq);
|
||||||
|
@ -391,7 +399,9 @@ namespace Kernel
|
||||||
|
|
||||||
ASSERT(Thread::current().state() != Thread::State::Terminated);
|
ASSERT(Thread::current().state() != Thread::State::Terminated);
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
Thread::current().load_sse();
|
Thread::current().load_sse();
|
||||||
|
#endif
|
||||||
}
|
}
|
||||||
|
|
||||||
void IDT::register_interrupt_handler(uint8_t index, void (*handler)())
|
void IDT::register_interrupt_handler(uint8_t index, void (*handler)())
|
||||||
|
|
|
@ -36,21 +36,6 @@ namespace Kernel
|
||||||
|
|
||||||
static pid_t s_next_tid = 1;
|
static pid_t s_next_tid = 1;
|
||||||
|
|
||||||
alignas(16) static uint8_t s_default_sse_storage[512];
|
|
||||||
static bool s_default_sse_storage_initialized = false;
|
|
||||||
|
|
||||||
static void initialize_default_sse_storage()
|
|
||||||
{
|
|
||||||
const uint32_t mxcsr = 0x1F80;
|
|
||||||
asm volatile(
|
|
||||||
"finit;"
|
|
||||||
"ldmxcsr %[mxcsr];"
|
|
||||||
"fxsave %[storage];"
|
|
||||||
: [storage]"=m"(s_default_sse_storage)
|
|
||||||
: [mxcsr]"m"(mxcsr)
|
|
||||||
);
|
|
||||||
}
|
|
||||||
|
|
||||||
BAN::ErrorOr<Thread*> Thread::create_kernel(entry_t entry, void* data, Process* process)
|
BAN::ErrorOr<Thread*> Thread::create_kernel(entry_t entry, void* data, Process* process)
|
||||||
{
|
{
|
||||||
// Create the thread object
|
// Create the thread object
|
||||||
|
@ -127,12 +112,10 @@ namespace Kernel
|
||||||
Thread::Thread(pid_t tid, Process* process)
|
Thread::Thread(pid_t tid, Process* process)
|
||||||
: m_tid(tid), m_process(process)
|
: m_tid(tid), m_process(process)
|
||||||
{
|
{
|
||||||
if (!s_default_sse_storage_initialized)
|
#if __enable_sse
|
||||||
{
|
// initializes sse storage to valid state
|
||||||
initialize_default_sse_storage();
|
save_sse();
|
||||||
s_default_sse_storage_initialized = true;
|
#endif
|
||||||
}
|
|
||||||
memcpy(m_sse_storage, s_default_sse_storage, sizeof(m_sse_storage));
|
|
||||||
}
|
}
|
||||||
|
|
||||||
Thread& Thread::current()
|
Thread& Thread::current()
|
||||||
|
@ -502,6 +485,7 @@ namespace Kernel
|
||||||
ASSERT_NOT_REACHED();
|
ASSERT_NOT_REACHED();
|
||||||
}
|
}
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
void Thread::save_sse()
|
void Thread::save_sse()
|
||||||
{
|
{
|
||||||
asm volatile("fxsave %0" :: "m"(m_sse_storage));
|
asm volatile("fxsave %0" :: "m"(m_sse_storage));
|
||||||
|
@ -511,5 +495,6 @@ namespace Kernel
|
||||||
{
|
{
|
||||||
asm volatile("fxrstor %0" :: "m"(m_sse_storage));
|
asm volatile("fxrstor %0" :: "m"(m_sse_storage));
|
||||||
}
|
}
|
||||||
|
#endif
|
||||||
|
|
||||||
}
|
}
|
||||||
|
|
|
@ -21,5 +21,10 @@ foreach(library ${USERSPACE_LIBRARIES})
|
||||||
target_link_options(${library_lower} PRIVATE -nolibc)
|
target_link_options(${library_lower} PRIVATE -nolibc)
|
||||||
# Default compile options
|
# Default compile options
|
||||||
target_compile_options(${library_lower} PRIVATE -g -O2 -Wall -Wextra -Werror)
|
target_compile_options(${library_lower} PRIVATE -g -O2 -Wall -Wextra -Werror)
|
||||||
|
|
||||||
|
target_compile_definitions(${library_lower} PRIVATE __enable_sse=${BANAN_ENABLE_SSE})
|
||||||
|
if (NOT BANAN_ENABLE_SSE)
|
||||||
|
target_compile_options(${library_lower} PRIVATE -mno-sse -mno-sse2)
|
||||||
|
endif ()
|
||||||
endif()
|
endif()
|
||||||
endforeach()
|
endforeach()
|
||||||
|
|
|
@ -6,7 +6,6 @@ set(LIBC_SOURCES
|
||||||
dlfcn.cpp
|
dlfcn.cpp
|
||||||
errno.cpp
|
errno.cpp
|
||||||
fcntl.cpp
|
fcntl.cpp
|
||||||
fenv.cpp
|
|
||||||
ftw.cpp
|
ftw.cpp
|
||||||
grp.cpp
|
grp.cpp
|
||||||
inttypes.cpp
|
inttypes.cpp
|
||||||
|
@ -49,6 +48,10 @@ set(LIBC_SOURCES
|
||||||
|
|
||||||
add_library(objlibc OBJECT ${LIBC_SOURCES})
|
add_library(objlibc OBJECT ${LIBC_SOURCES})
|
||||||
target_compile_definitions(objlibc PRIVATE __arch=${BANAN_ARCH})
|
target_compile_definitions(objlibc PRIVATE __arch=${BANAN_ARCH})
|
||||||
|
target_compile_definitions(objlibc PRIVATE __enable_sse=${BANAN_ENABLE_SSE})
|
||||||
|
if (NOT BANAN_ENABLE_SSE)
|
||||||
|
target_compile_options(objlibc PRIVATE -mno-sse -mno-sse2)
|
||||||
|
endif ()
|
||||||
|
|
||||||
target_compile_options(objlibc PRIVATE -O2 -g -Wstack-usage=512 -fno-tree-loop-distribute-patterns -fno-exceptions -fpic -nolibc)
|
target_compile_options(objlibc PRIVATE -O2 -g -Wstack-usage=512 -fno-tree-loop-distribute-patterns -fno-exceptions -fpic -nolibc)
|
||||||
target_compile_options(objlibc PUBLIC -Wall -Wextra -Werror -Wno-error=stack-usage=)
|
target_compile_options(objlibc PUBLIC -Wall -Wextra -Werror -Wno-error=stack-usage=)
|
||||||
|
|
|
@ -1,134 +0,0 @@
|
||||||
#include <fenv.h>
|
|
||||||
|
|
||||||
static uint16_t read_fpu_control_word()
|
|
||||||
{
|
|
||||||
uint16_t control;
|
|
||||||
asm volatile("fstcw %0" : "=m"(control));
|
|
||||||
return control;
|
|
||||||
}
|
|
||||||
|
|
||||||
static uint16_t read_fpu_status_word()
|
|
||||||
{
|
|
||||||
uint16_t status;
|
|
||||||
asm volatile("fstsw %0" : "=m"(status));
|
|
||||||
return status;
|
|
||||||
}
|
|
||||||
|
|
||||||
static uint32_t read_mxcsr()
|
|
||||||
{
|
|
||||||
uint32_t mxcsr;
|
|
||||||
asm volatile("stmxcsr %0" : "=m"(mxcsr));
|
|
||||||
return mxcsr;
|
|
||||||
}
|
|
||||||
|
|
||||||
static void write_fpu_control_word(uint16_t control)
|
|
||||||
{
|
|
||||||
asm volatile("fldcw %0" :: "m"(control));
|
|
||||||
}
|
|
||||||
|
|
||||||
static void write_mxcsr(uint32_t mxcsr)
|
|
||||||
{
|
|
||||||
asm volatile("ldmxcsr %0" :: "m"(mxcsr));
|
|
||||||
}
|
|
||||||
|
|
||||||
int fegetenv(fenv_t* envp)
|
|
||||||
{
|
|
||||||
asm volatile("fstenv %0" : "=m"(envp->x87_fpu));
|
|
||||||
envp->mxcsr = read_mxcsr();
|
|
||||||
return 0;
|
|
||||||
}
|
|
||||||
|
|
||||||
int fesetenv(const fenv_t* envp)
|
|
||||||
{
|
|
||||||
if (envp == FE_DFL_ENV)
|
|
||||||
{
|
|
||||||
asm volatile("finit");
|
|
||||||
write_mxcsr(0x1F80);
|
|
||||||
return 0;
|
|
||||||
}
|
|
||||||
|
|
||||||
asm volatile("fldenv %0" :: "m"(envp->x87_fpu));
|
|
||||||
write_mxcsr(envp->mxcsr);
|
|
||||||
return 0;
|
|
||||||
}
|
|
||||||
|
|
||||||
int fegetround(void)
|
|
||||||
{
|
|
||||||
return (read_fpu_control_word() >> 10) & 0x03;
|
|
||||||
}
|
|
||||||
|
|
||||||
int fesetround(int round)
|
|
||||||
{
|
|
||||||
uint16_t control = read_fpu_control_word();
|
|
||||||
control &= ~(3 << 10);
|
|
||||||
control |= round << 10;
|
|
||||||
write_fpu_control_word(control);
|
|
||||||
|
|
||||||
uint32_t mxcsr = read_mxcsr();
|
|
||||||
mxcsr &= ~(3 << 13);
|
|
||||||
mxcsr |= round << 13;
|
|
||||||
write_mxcsr(mxcsr);
|
|
||||||
|
|
||||||
return 0;
|
|
||||||
}
|
|
||||||
|
|
||||||
int feclearexcept(int excepts)
|
|
||||||
{
|
|
||||||
excepts &= FE_ALL_EXCEPT;
|
|
||||||
|
|
||||||
fenv_t temp_env;
|
|
||||||
fegetenv(&temp_env);
|
|
||||||
temp_env.x87_fpu.status &= ~(excepts | (1 << 7));
|
|
||||||
temp_env.mxcsr &= ~excepts;
|
|
||||||
fesetenv(&temp_env);
|
|
||||||
return 0;
|
|
||||||
}
|
|
||||||
|
|
||||||
int fetestexcept(int excepts)
|
|
||||||
{
|
|
||||||
excepts &= FE_ALL_EXCEPT;
|
|
||||||
|
|
||||||
const uint16_t status = read_fpu_status_word();
|
|
||||||
const uint32_t mxcsr = read_mxcsr();
|
|
||||||
return (status | mxcsr) & excepts;
|
|
||||||
}
|
|
||||||
|
|
||||||
int feholdexcept(fenv_t*);
|
|
||||||
|
|
||||||
int feraiseexcept(int excepts)
|
|
||||||
{
|
|
||||||
excepts &= FE_ALL_EXCEPT;
|
|
||||||
|
|
||||||
fenv_t temp_env;
|
|
||||||
fegetenv(&temp_env);
|
|
||||||
temp_env.x87_fpu.status |= excepts;
|
|
||||||
fesetenv(&temp_env);
|
|
||||||
asm volatile("fwait");
|
|
||||||
return 0;
|
|
||||||
}
|
|
||||||
|
|
||||||
int fegetexceptflag(fexcept_t* flagp, int excepts)
|
|
||||||
{
|
|
||||||
*flagp = fetestexcept(excepts);
|
|
||||||
return 0;
|
|
||||||
}
|
|
||||||
|
|
||||||
int fesetexceptflag(const fexcept_t* flagp, int excepts)
|
|
||||||
{
|
|
||||||
excepts &= FE_ALL_EXCEPT;
|
|
||||||
|
|
||||||
fenv_t temp_env;
|
|
||||||
fegetenv(&temp_env);
|
|
||||||
temp_env.x87_fpu.status &= ~(FE_ALL_EXCEPT | (1 << 7));
|
|
||||||
temp_env.x87_fpu.status |= *flagp & excepts;
|
|
||||||
fesetenv(&temp_env);
|
|
||||||
return 0;
|
|
||||||
}
|
|
||||||
|
|
||||||
int feupdateenv(const fenv_t* envp)
|
|
||||||
{
|
|
||||||
int excepts = fetestexcept(FE_ALL_EXCEPT);
|
|
||||||
fesetenv(envp);
|
|
||||||
feraiseexcept(excepts);
|
|
||||||
return 0;
|
|
||||||
}
|
|
|
@ -7,46 +7,7 @@
|
||||||
|
|
||||||
__BEGIN_DECLS
|
__BEGIN_DECLS
|
||||||
|
|
||||||
#include <stdint.h>
|
// FIXME
|
||||||
|
|
||||||
#define FE_INVALID (1 << 0)
|
|
||||||
#define FE_DIVBYZERO (1 << 2)
|
|
||||||
#define FE_OVERFLOW (1 << 3)
|
|
||||||
#define FE_UNDERFLOW (1 << 4)
|
|
||||||
#define FE_INEXACT (1 << 5)
|
|
||||||
#define FE_ALL_EXCEPT (FE_INVALID | FE_DIVBYZERO | FE_OVERFLOW | FE_UNDERFLOW | FE_INEXACT)
|
|
||||||
|
|
||||||
#define FE_TONEAREST 0
|
|
||||||
#define FE_DOWNWARD 1
|
|
||||||
#define FE_UPWARD 2
|
|
||||||
#define FE_TOWARDZERO 3
|
|
||||||
|
|
||||||
typedef struct {
|
|
||||||
uint32_t control;
|
|
||||||
uint32_t status;
|
|
||||||
uint32_t __unused[5];
|
|
||||||
} __x87_fpu_t;
|
|
||||||
|
|
||||||
typedef struct {
|
|
||||||
__x87_fpu_t x87_fpu;
|
|
||||||
uint32_t mxcsr;
|
|
||||||
} fenv_t;
|
|
||||||
|
|
||||||
typedef uint8_t fexcept_t;
|
|
||||||
|
|
||||||
#define FE_DFL_ENV ((const fenv_t*)0x1)
|
|
||||||
|
|
||||||
int feclearexcept(int);
|
|
||||||
int fegetenv(fenv_t*);
|
|
||||||
int fegetexceptflag(fexcept_t*, int);
|
|
||||||
int fegetround(void);
|
|
||||||
int feholdexcept(fenv_t*);
|
|
||||||
int feraiseexcept(int);
|
|
||||||
int fesetenv(const fenv_t*);
|
|
||||||
int fesetexceptflag(const fexcept_t*, int);
|
|
||||||
int fesetround(int);
|
|
||||||
int fetestexcept(int);
|
|
||||||
int feupdateenv(const fenv_t*);
|
|
||||||
|
|
||||||
__END_DECLS
|
__END_DECLS
|
||||||
|
|
||||||
|
|
|
@ -5,8 +5,6 @@
|
||||||
|
|
||||||
#include <sys/cdefs.h>
|
#include <sys/cdefs.h>
|
||||||
|
|
||||||
#include <float.h>
|
|
||||||
|
|
||||||
__BEGIN_DECLS
|
__BEGIN_DECLS
|
||||||
|
|
||||||
#ifndef FLT_EVAL_METHOD
|
#ifndef FLT_EVAL_METHOD
|
||||||
|
@ -24,7 +22,9 @@ __BEGIN_DECLS
|
||||||
typedef long double double_t;
|
typedef long double double_t;
|
||||||
#endif
|
#endif
|
||||||
|
|
||||||
#define fpclassify(x) __builtin_fpclassify(FP_NAN, FP_INFINITE, FP_NORMAL, FP_SUBNORMAL, FP_ZERO, x)
|
// FIXME: define this
|
||||||
|
// int fpclassify(real-floating x);
|
||||||
|
|
||||||
#define isfinite(x) __builtin_isfinite(x)
|
#define isfinite(x) __builtin_isfinite(x)
|
||||||
#define isgreater(x, y) __builtin_isgreater(x, y)
|
#define isgreater(x, y) __builtin_isgreater(x, y)
|
||||||
#define isgreaterequal(x, y) __builtin_isgreaterequal(x, y)
|
#define isgreaterequal(x, y) __builtin_isgreaterequal(x, y)
|
||||||
|
@ -191,9 +191,9 @@ long lroundl(long double);
|
||||||
double modf(double, double*);
|
double modf(double, double*);
|
||||||
float modff(float, float*);
|
float modff(float, float*);
|
||||||
long double modfl(long double, long double*);
|
long double modfl(long double, long double*);
|
||||||
#define nan(tagp) __builtin_nan(tagp)
|
double nan(const char*);
|
||||||
#define nanf(tagp) __builtin_nanf(tagp)
|
float nanf(const char*);
|
||||||
#define nanl(tagp) __builtin_nanl(tagp)
|
long double nanl(const char*);
|
||||||
double nearbyint(double);
|
double nearbyint(double);
|
||||||
float nearbyintf(float);
|
float nearbyintf(float);
|
||||||
long double nearbyintl(long double);
|
long double nearbyintl(long double);
|
||||||
|
|
|
@ -2,4 +2,4 @@
|
||||||
|
|
||||||
#include <stdarg.h>
|
#include <stdarg.h>
|
||||||
|
|
||||||
int scanf_impl(const char* format, va_list arguments, int (*getc_fun)(bool advance, void*), void* data);
|
int scanf_impl(const char* format, va_list arguments, int (*getc_fun)(void*), void* data);
|
||||||
|
|
|
@ -1,285 +1,71 @@
|
||||||
#include <BAN/Math.h>
|
|
||||||
|
|
||||||
#include <math.h>
|
#include <math.h>
|
||||||
#include <stddef.h>
|
|
||||||
|
|
||||||
#define BAN_FUNC1(func) \
|
#define BUILTINS1(func) \
|
||||||
float func##f(float a) { return BAN::Math::func<float>(a); } \
|
float func##f(float a) { return __builtin_##func##f(a); } \
|
||||||
double func(double a) { return BAN::Math::func<double>(a); } \
|
double func(double a) { return __builtin_##func(a); } \
|
||||||
long double func##l(long double a) { return BAN::Math::func<long double>(a); }
|
long double func##l(long double a) { return __builtin_##func##l(a); }
|
||||||
|
|
||||||
#define BAN_FUNC2(func) \
|
#define BUILTINS2(func) \
|
||||||
float func##f(float a, float b) { return BAN::Math::func<float>(a, b); } \
|
float func##f(float a, float b) { return __builtin_##func##f(a, b); } \
|
||||||
double func(double a, double b) { return BAN::Math::func<double>(a, b); } \
|
double func(double a, double b) { return __builtin_##func(a, b); } \
|
||||||
long double func##l(long double a, long double b) { return BAN::Math::func<long double>(a, b); }
|
long double func##l(long double a, long double b) { return __builtin_##func##l(a, b); }
|
||||||
|
|
||||||
#define BAN_FUNC2_PTR(func) \
|
#define BUILTINS2_TYPE(func, type) \
|
||||||
float func##f(float a, float* b) { return BAN::Math::func<float>(a, b); } \
|
float func##f(float a, type b) { return __builtin_##func##f(a, b); } \
|
||||||
double func(double a, double* b) { return BAN::Math::func<double>(a, b); } \
|
double func(double a, type b) { return __builtin_##func(a, b); } \
|
||||||
long double func##l(long double a, long double* b) { return BAN::Math::func<long double>(a, b); }
|
long double func##l(long double a, type b) { return __builtin_##func##l(a, b); }
|
||||||
|
|
||||||
#define BAN_FUNC2_TYPE(func, type) \
|
|
||||||
float func##f(float a, type b) { return BAN::Math::func<float>(a, b); } \
|
|
||||||
double func(double a, type b) { return BAN::Math::func<double>(a, b); } \
|
|
||||||
long double func##l(long double a, type b) { return BAN::Math::func<long double>(a, b); }
|
|
||||||
|
|
||||||
#define FUNC_EXPR1(func, ...) \
|
|
||||||
float func##f(float a) { return __VA_ARGS__; } \
|
|
||||||
double func(double a) { return __VA_ARGS__; } \
|
|
||||||
long double func##l(long double a) { return __VA_ARGS__; }
|
|
||||||
|
|
||||||
#define FUNC_EXPR2(func, ...) \
|
|
||||||
float func##f(float a, float b) { return __VA_ARGS__; } \
|
|
||||||
double func(double a, double b) { return __VA_ARGS__; } \
|
|
||||||
long double func##l(long double a, long double b) { return __VA_ARGS__; }
|
|
||||||
|
|
||||||
#define FUNC_EXPR3(func, ...) \
|
|
||||||
float func##f(float a, float b, float c) { return __VA_ARGS__; } \
|
|
||||||
double func(double a, double b, double c) { return __VA_ARGS__; } \
|
|
||||||
long double func##l(long double a, long double b, long double c) { return __VA_ARGS__; }
|
|
||||||
|
|
||||||
#define FUNC_EXPR1_RET(func, ret, ...) \
|
|
||||||
ret func##f(float a) { return __VA_ARGS__; } \
|
|
||||||
ret func(double a) { return __VA_ARGS__; } \
|
|
||||||
ret func##l(long double a) { return __VA_ARGS__; }
|
|
||||||
|
|
||||||
#define FUNC_EXPR2_TYPE(func, type, ...) \
|
|
||||||
float func##f(float a, type b) { return __VA_ARGS__; } \
|
|
||||||
double func(double a, type b) { return __VA_ARGS__; } \
|
|
||||||
long double func##l(long double a, type b) { return __VA_ARGS__; }
|
|
||||||
|
|
||||||
template<BAN::floating_point T>
|
|
||||||
struct integral_atleast;
|
|
||||||
|
|
||||||
template<BAN::floating_point T> requires(sizeof(T) <= sizeof(uint8_t))
|
|
||||||
struct integral_atleast<T> { using type = uint8_t; };
|
|
||||||
|
|
||||||
template<BAN::floating_point T> requires(sizeof(T) > sizeof(uint8_t) && sizeof(T) <= sizeof(uint16_t))
|
|
||||||
struct integral_atleast<T> { using type = uint16_t; };
|
|
||||||
|
|
||||||
template<BAN::floating_point T> requires(sizeof(T) > sizeof(uint16_t) && sizeof(T) <= sizeof(uint32_t))
|
|
||||||
struct integral_atleast<T> { using type = uint32_t; };
|
|
||||||
|
|
||||||
template<BAN::floating_point T> requires(sizeof(T) > sizeof(uint32_t) && sizeof(T) <= sizeof(uint64_t))
|
|
||||||
struct integral_atleast<T> { using type = uint64_t; };
|
|
||||||
|
|
||||||
template<BAN::floating_point T> requires(sizeof(T) > sizeof(uint64_t) && sizeof(T) <= sizeof(__uint128_t))
|
|
||||||
struct integral_atleast<T> { using type = __uint128_t; };
|
|
||||||
|
|
||||||
template<BAN::integral T, size_t mantissa_bits, size_t exponent_bits, bool integral>
|
|
||||||
struct __FloatDecompose;
|
|
||||||
|
|
||||||
template<BAN::integral T, size_t mantissa_bits, size_t exponent_bits>
|
|
||||||
struct __FloatDecompose<T, mantissa_bits, exponent_bits, true>
|
|
||||||
{
|
|
||||||
T mantissa : mantissa_bits;
|
|
||||||
T : 1;
|
|
||||||
T exponent : exponent_bits;
|
|
||||||
T sign : 1;
|
|
||||||
};
|
|
||||||
|
|
||||||
template<BAN::integral T, size_t mantissa_bits, size_t exponent_bits>
|
|
||||||
struct __FloatDecompose<T, mantissa_bits, exponent_bits, false>
|
|
||||||
{
|
|
||||||
T mantissa : mantissa_bits;
|
|
||||||
T exponent : exponent_bits;
|
|
||||||
T sign : 1;
|
|
||||||
};
|
|
||||||
|
|
||||||
template<BAN::floating_point T>
|
|
||||||
struct FloatDecompose
|
|
||||||
{
|
|
||||||
using value_type = integral_atleast<T>::type;
|
|
||||||
|
|
||||||
static constexpr size_t mantissa_bits
|
|
||||||
= BAN::is_same_v<T, float> ? FLT_MANT_DIG - 1
|
|
||||||
: BAN::is_same_v<T, double> ? DBL_MANT_DIG - 1
|
|
||||||
: BAN::is_same_v<T, long double> ? LDBL_MANT_DIG - 1
|
|
||||||
: 0;
|
|
||||||
|
|
||||||
static constexpr size_t exponent_bits
|
|
||||||
= BAN::is_same_v<T, float> ? 8
|
|
||||||
: BAN::is_same_v<T, double> ? 11
|
|
||||||
: BAN::is_same_v<T, long double> ? 15
|
|
||||||
: 0;
|
|
||||||
|
|
||||||
static constexpr value_type mantissa_max
|
|
||||||
= (static_cast<value_type>(1) << mantissa_bits) - 1;
|
|
||||||
|
|
||||||
static constexpr value_type exponent_max
|
|
||||||
= (static_cast<value_type>(1) << exponent_bits) - 1;
|
|
||||||
|
|
||||||
FloatDecompose(T x)
|
|
||||||
: raw(x)
|
|
||||||
{}
|
|
||||||
|
|
||||||
union
|
|
||||||
{
|
|
||||||
T raw;
|
|
||||||
__FloatDecompose<
|
|
||||||
value_type,
|
|
||||||
mantissa_bits,
|
|
||||||
exponent_bits,
|
|
||||||
BAN::is_same_v<T, long double>
|
|
||||||
> bits;
|
|
||||||
};
|
|
||||||
};
|
|
||||||
|
|
||||||
template<BAN::floating_point T1, BAN::floating_point T2>
|
|
||||||
static T1 nextafter_impl(T1 x, T2 y)
|
|
||||||
{
|
|
||||||
if (isnan(x) || isnan(y))
|
|
||||||
return BAN::numeric_limits<T1>::quiet_NaN();
|
|
||||||
|
|
||||||
if (!isfinite(x) || x == y)
|
|
||||||
return x;
|
|
||||||
|
|
||||||
FloatDecompose<T1> decompose(x);
|
|
||||||
|
|
||||||
// at zero
|
|
||||||
if ((T2)x == (T2)0.0)
|
|
||||||
{
|
|
||||||
decompose.bits.mantissa = 1;
|
|
||||||
decompose.bits.sign = (x > y);
|
|
||||||
return decompose.raw;
|
|
||||||
}
|
|
||||||
|
|
||||||
// away from zero
|
|
||||||
if ((x > y) == decompose.bits.sign)
|
|
||||||
{
|
|
||||||
decompose.bits.mantissa++;
|
|
||||||
if (decompose.bits.mantissa == 0)
|
|
||||||
{
|
|
||||||
decompose.bits.exponent++;
|
|
||||||
if (decompose.bits.exponent == decompose.exponent_max)
|
|
||||||
decompose.bits.mantissa = 0;
|
|
||||||
}
|
|
||||||
return decompose.raw;
|
|
||||||
}
|
|
||||||
|
|
||||||
// towards zero
|
|
||||||
decompose.bits.mantissa--;
|
|
||||||
if (decompose.bits.mantissa == decompose.mantissa_max)
|
|
||||||
{
|
|
||||||
if (decompose.bits.exponent == 0)
|
|
||||||
return 0.0;
|
|
||||||
decompose.bits.exponent--;
|
|
||||||
}
|
|
||||||
|
|
||||||
return decompose.raw;
|
|
||||||
}
|
|
||||||
|
|
||||||
static long double tgamma_impl(long double x)
|
|
||||||
{
|
|
||||||
constexpr long double pi = BAN::numbers::pi_v<long double>;
|
|
||||||
|
|
||||||
if (x == 0.0L)
|
|
||||||
return BAN::numeric_limits<long double>::infinity();
|
|
||||||
|
|
||||||
// reflection formula
|
|
||||||
if (x < 0.5L)
|
|
||||||
return pi / (BAN::Math::sin(pi * x) * tgamma_impl(1.0L - x));
|
|
||||||
x -= 1.0L;
|
|
||||||
|
|
||||||
// Lanczos approximation
|
|
||||||
|
|
||||||
constexpr long double g = 8.0L;
|
|
||||||
constexpr long double p[] {
|
|
||||||
0.9999999999999999298e+0L,
|
|
||||||
1.9753739023578852322e+3L,
|
|
||||||
-4.3973823927922428918e+3L,
|
|
||||||
3.4626328459862717019e+3L,
|
|
||||||
-1.1569851431631167820e+3L,
|
|
||||||
1.5453815050252775060e+2L,
|
|
||||||
-6.2536716123689161798e+0L,
|
|
||||||
3.4642762454736807441e-2L,
|
|
||||||
-7.4776171974442977377e-7L,
|
|
||||||
6.3041253821852264261e-8L,
|
|
||||||
-2.7405717035683877489e-8L,
|
|
||||||
4.0486948817567609101e-9L
|
|
||||||
};
|
|
||||||
constexpr long double sqrt_2pi = 2.5066282746310005024L;
|
|
||||||
|
|
||||||
long double A = p[0];
|
|
||||||
for (size_t i = 1; i < sizeof(p) / sizeof(*p); i++)
|
|
||||||
A += p[i] / (x + i);
|
|
||||||
|
|
||||||
const long double t = x + g + 0.5L;
|
|
||||||
return sqrt_2pi * BAN::Math::pow(t, x + 0.5L) * BAN::Math::exp(-t) * A;
|
|
||||||
}
|
|
||||||
|
|
||||||
static long double erf_impl(long double x)
|
|
||||||
{
|
|
||||||
long double sum = 0.0L;
|
|
||||||
for (size_t n = 0; n < 100; n++)
|
|
||||||
sum += x / (2.0L * n + 1.0L) * BAN::Math::ldexp(-x * x, n) / tgamma_impl(n + 1.0L);
|
|
||||||
|
|
||||||
constexpr long double sqrt_pi = 1.77245385090551602729L;
|
|
||||||
return 2.0L / sqrt_pi * sum;
|
|
||||||
}
|
|
||||||
|
|
||||||
__BEGIN_DECLS
|
__BEGIN_DECLS
|
||||||
|
|
||||||
// FIXME: add handling for nan and infinity values
|
#if __enable_sse
|
||||||
|
BUILTINS1(acos)
|
||||||
BAN_FUNC1(acos)
|
BUILTINS1(acosh)
|
||||||
BAN_FUNC1(acosh)
|
BUILTINS1(asin)
|
||||||
BAN_FUNC1(asin)
|
BUILTINS1(asinh)
|
||||||
BAN_FUNC1(asinh)
|
BUILTINS1(atan)
|
||||||
BAN_FUNC1(atan)
|
BUILTINS2(atan2)
|
||||||
BAN_FUNC2(atan2)
|
BUILTINS1(atanh)
|
||||||
BAN_FUNC1(atanh)
|
BUILTINS1(cbrt)
|
||||||
BAN_FUNC1(cbrt)
|
BUILTINS1(ceil)
|
||||||
BAN_FUNC1(ceil)
|
BUILTINS2(copysign)
|
||||||
BAN_FUNC2(copysign)
|
BUILTINS1(cos)
|
||||||
BAN_FUNC1(cos)
|
BUILTINS1(cosh)
|
||||||
BAN_FUNC1(cosh)
|
BUILTINS1(erf)
|
||||||
FUNC_EXPR1(erf, erf_impl(a))
|
BUILTINS1(erfc)
|
||||||
FUNC_EXPR1(erfc, 1.0 - erf_impl(a))
|
BUILTINS1(exp)
|
||||||
BAN_FUNC1(exp)
|
BUILTINS1(exp2)
|
||||||
BAN_FUNC1(exp2)
|
BUILTINS1(expm1)
|
||||||
FUNC_EXPR1(expm1, ({ a -= 1.0; BAN::Math::exp(a); }))
|
BUILTINS1(fabs)
|
||||||
FUNC_EXPR1(fabs, BAN::Math::abs(a))
|
BUILTINS2(fdim)
|
||||||
FUNC_EXPR2(fdim, a > b ? a - b : 0.0)
|
BUILTINS1(floor)
|
||||||
BAN_FUNC1(floor)
|
BUILTINS2(fmax)
|
||||||
FUNC_EXPR3(fma, (a * b) + c)
|
BUILTINS2(fmin)
|
||||||
FUNC_EXPR2(fmax, a < b ? b : a)
|
BUILTINS2(fmod)
|
||||||
FUNC_EXPR2(fmin, a < b ? a : b)
|
BUILTINS2(hypot)
|
||||||
BAN_FUNC2(fmod)
|
BUILTINS1(j0)
|
||||||
BAN_FUNC2_TYPE(frexp, int*)
|
BUILTINS1(j1)
|
||||||
BAN_FUNC2(hypot)
|
BUILTINS2_TYPE(ldexp, int)
|
||||||
FUNC_EXPR1_RET(ilogb, int, BAN::Math::logb(a))
|
BUILTINS1(lgamma)
|
||||||
// j0, j1, jn
|
BUILTINS1(log)
|
||||||
BAN_FUNC2_TYPE(ldexp, int)
|
BUILTINS1(log10)
|
||||||
FUNC_EXPR1(lgamma, BAN::Math::log(BAN::Math::abs(tgamma_impl(a))))
|
BUILTINS1(log1p)
|
||||||
FUNC_EXPR1_RET(llrint, long long, BAN::Math::rint(a))
|
BUILTINS1(log2)
|
||||||
FUNC_EXPR1_RET(llround, long long, BAN::Math::round(a))
|
BUILTINS1(logb)
|
||||||
BAN_FUNC1(log)
|
BUILTINS1(nearbyint)
|
||||||
BAN_FUNC1(log10)
|
BUILTINS2(nextafter)
|
||||||
FUNC_EXPR1(log1p, ({ a += 1.0; BAN::Math::log(a); }));
|
BUILTINS2(pow)
|
||||||
BAN_FUNC1(log2)
|
BUILTINS2(remainder)
|
||||||
BAN_FUNC1(logb)
|
BUILTINS1(rint)
|
||||||
FUNC_EXPR1_RET(lrint, long, BAN::Math::rint(a))
|
BUILTINS1(round)
|
||||||
FUNC_EXPR1_RET(lround, long, BAN::Math::round(a))
|
BUILTINS1(sin)
|
||||||
BAN_FUNC2_PTR(modf)
|
BUILTINS1(sinh)
|
||||||
FUNC_EXPR1(nearbyint, BAN::Math::rint(a))
|
BUILTINS1(sqrt)
|
||||||
FUNC_EXPR2(nextafter, nextafter_impl(a, b))
|
BUILTINS1(tan)
|
||||||
FUNC_EXPR2_TYPE(nexttoward, long double, nextafter_impl(a, b))
|
BUILTINS1(tanh)
|
||||||
FUNC_EXPR2(pow, ({ if (isnan(a)) return a; if (isnan(b)) return b; BAN::Math::pow(a, b); }))
|
BUILTINS1(tgamma)
|
||||||
// remainder
|
BUILTINS1(trunc)
|
||||||
// remquo
|
BUILTINS1(y0)
|
||||||
BAN_FUNC1(rint)
|
BUILTINS1(y1)
|
||||||
FUNC_EXPR1(round, ({ if (!isfinite(a)) return a; BAN::Math::round(a); }))
|
#endif
|
||||||
FUNC_EXPR2_TYPE(scalbln, long, BAN::Math::scalbn(a, b))
|
|
||||||
FUNC_EXPR2_TYPE(scalbn, int, BAN::Math::scalbn(a, b))
|
|
||||||
BAN_FUNC1(sin)
|
|
||||||
BAN_FUNC1(sinh)
|
|
||||||
BAN_FUNC1(sqrt)
|
|
||||||
BAN_FUNC1(tan)
|
|
||||||
BAN_FUNC1(tanh)
|
|
||||||
FUNC_EXPR1(tgamma, tgamma_impl(a))
|
|
||||||
BAN_FUNC1(trunc)
|
|
||||||
// y0, y1, yn
|
|
||||||
|
|
||||||
|
|
||||||
__END_DECLS
|
__END_DECLS
|
||||||
|
|
|
@ -129,6 +129,7 @@ static void integer_to_string(char* buffer, T value, int base, bool upper, forma
|
||||||
buffer[offset++] = '\0';
|
buffer[offset++] = '\0';
|
||||||
}
|
}
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
template<BAN::floating_point T>
|
template<BAN::floating_point T>
|
||||||
static void floating_point_to_string(char* buffer, T value, bool upper, const format_options_t options)
|
static void floating_point_to_string(char* buffer, T value, bool upper, const format_options_t options)
|
||||||
{
|
{
|
||||||
|
@ -258,6 +259,7 @@ static void floating_point_to_exponent_string(char* buffer, T value, bool upper,
|
||||||
exponent_options.width = 3;
|
exponent_options.width = 3;
|
||||||
integer_to_string<int>(buffer + offset, exponent, 10, upper, exponent_options);
|
integer_to_string<int>(buffer + offset, exponent, 10, upper, exponent_options);
|
||||||
}
|
}
|
||||||
|
#endif
|
||||||
|
|
||||||
extern "C" int printf_impl(const char* format, va_list arguments, int (*putc_fun)(int, void*), void* data)
|
extern "C" int printf_impl(const char* format, va_list arguments, int (*putc_fun)(int, void*), void* data)
|
||||||
{
|
{
|
||||||
|
@ -494,6 +496,7 @@ extern "C" int printf_impl(const char* format, va_list arguments, int (*putc_fun
|
||||||
format++;
|
format++;
|
||||||
break;
|
break;
|
||||||
}
|
}
|
||||||
|
#if __enable_sse
|
||||||
case 'e':
|
case 'e':
|
||||||
case 'E':
|
case 'E':
|
||||||
{
|
{
|
||||||
|
@ -526,6 +529,7 @@ extern "C" int printf_impl(const char* format, va_list arguments, int (*putc_fun
|
||||||
case 'A':
|
case 'A':
|
||||||
// TODO
|
// TODO
|
||||||
break;
|
break;
|
||||||
|
#endif
|
||||||
case 'c':
|
case 'c':
|
||||||
{
|
{
|
||||||
conversion[0] = va_arg(arguments, int);
|
conversion[0] = va_arg(arguments, int);
|
||||||
|
|
|
@ -112,9 +112,9 @@ using BASE_TYPE = BAN::integral_constant<int, BASE>;
|
||||||
template<bool UNSIGNED>
|
template<bool UNSIGNED>
|
||||||
using IS_UNSIGNED = BAN::integral_constant<bool, UNSIGNED>;
|
using IS_UNSIGNED = BAN::integral_constant<bool, UNSIGNED>;
|
||||||
|
|
||||||
int scanf_impl(const char* format, va_list arguments, int (*__getc_fun)(bool advance, void*), void* data)
|
int scanf_impl(const char* format, va_list arguments, int (*__getc_fun)(void*), void* data)
|
||||||
{
|
{
|
||||||
static constexpr int DONE = EOF;
|
static constexpr int DONE = -1;
|
||||||
static constexpr int NONE = -2;
|
static constexpr int NONE = -2;
|
||||||
|
|
||||||
int nread = 0;
|
int nread = 0;
|
||||||
|
@ -134,9 +134,11 @@ int scanf_impl(const char* format, va_list arguments, int (*__getc_fun)(bool adv
|
||||||
{
|
{
|
||||||
if (in == DONE)
|
if (in == DONE)
|
||||||
return;
|
return;
|
||||||
in = __getc_fun(advance, data);
|
if (advance || in == NONE)
|
||||||
if (advance)
|
{
|
||||||
|
in = __getc_fun(data);
|
||||||
nread++;
|
nread++;
|
||||||
|
}
|
||||||
};
|
};
|
||||||
|
|
||||||
auto parse_integer_internal =
|
auto parse_integer_internal =
|
||||||
|
@ -260,6 +262,7 @@ int scanf_impl(const char* format, va_list arguments, int (*__getc_fun)(bool adv
|
||||||
}
|
}
|
||||||
};
|
};
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
auto parse_floating_point_internal =
|
auto parse_floating_point_internal =
|
||||||
[&parse_integer_internal, &get_input, &in]<int BASE, typename T>(BASE_TYPE<BASE>, bool negative, int width, T* out, bool require_start = true) -> ConversionResult
|
[&parse_integer_internal, &get_input, &in]<int BASE, typename T>(BASE_TYPE<BASE>, bool negative, int width, T* out, bool require_start = true) -> ConversionResult
|
||||||
{
|
{
|
||||||
|
@ -434,6 +437,7 @@ int scanf_impl(const char* format, va_list arguments, int (*__getc_fun)(bool adv
|
||||||
return ConversionResult::MATCH_FAILURE;
|
return ConversionResult::MATCH_FAILURE;
|
||||||
}
|
}
|
||||||
};
|
};
|
||||||
|
#endif
|
||||||
|
|
||||||
auto parse_string =
|
auto parse_string =
|
||||||
[&arguments, &get_input, &in](uint8_t* mask, bool exclude, bool suppress, bool allocate, int min_len, int max_len, bool terminate) -> ConversionResult
|
[&arguments, &get_input, &in](uint8_t* mask, bool exclude, bool suppress, bool allocate, int min_len, int max_len, bool terminate) -> ConversionResult
|
||||||
|
@ -518,9 +522,11 @@ int scanf_impl(const char* format, va_list arguments, int (*__getc_fun)(bool adv
|
||||||
case 'x': result = parse_integer(BASE_TYPE<16>{}, IS_UNSIGNED<true> {}, conversion.suppress, conversion.field_width, conversion.length); break;
|
case 'x': result = parse_integer(BASE_TYPE<16>{}, IS_UNSIGNED<true> {}, conversion.suppress, conversion.field_width, conversion.length); break;
|
||||||
case 'X': result = parse_integer(BASE_TYPE<16>{}, IS_UNSIGNED<true> {}, conversion.suppress, conversion.field_width, conversion.length); break;
|
case 'X': result = parse_integer(BASE_TYPE<16>{}, IS_UNSIGNED<true> {}, conversion.suppress, conversion.field_width, conversion.length); break;
|
||||||
case 'p': result = parse_integer(BASE_TYPE<16>{}, IS_UNSIGNED<true> {}, conversion.suppress, conversion.field_width, LengthModifier::j); break;
|
case 'p': result = parse_integer(BASE_TYPE<16>{}, IS_UNSIGNED<true> {}, conversion.suppress, conversion.field_width, LengthModifier::j); break;
|
||||||
|
#if __enable_sse
|
||||||
case 'a': case 'e': case 'f': case 'g':
|
case 'a': case 'e': case 'f': case 'g':
|
||||||
result = parse_floating_point(conversion.suppress, conversion.field_width, conversion.length);
|
result = parse_floating_point(conversion.suppress, conversion.field_width, conversion.length);
|
||||||
break;
|
break;
|
||||||
|
#endif
|
||||||
case 'S':
|
case 'S':
|
||||||
conversion.length = LengthModifier::l;
|
conversion.length = LengthModifier::l;
|
||||||
// fall through
|
// fall through
|
||||||
|
|
|
@ -794,10 +794,11 @@ char* tmpnam(char* storage)
|
||||||
return storage;
|
return storage;
|
||||||
}
|
}
|
||||||
|
|
||||||
int ungetc_unlocked(int c, FILE* stream)
|
int ungetc(int c, FILE* stream)
|
||||||
{
|
{
|
||||||
if (c == EOF)
|
if (c == EOF)
|
||||||
return EOF;
|
return EOF;
|
||||||
|
ScopeLock _(stream);
|
||||||
if (stream->unget_char != EOF)
|
if (stream->unget_char != EOF)
|
||||||
return EOF;
|
return EOF;
|
||||||
stream->unget_char = c;
|
stream->unget_char = c;
|
||||||
|
@ -805,12 +806,6 @@ int ungetc_unlocked(int c, FILE* stream)
|
||||||
return (unsigned char)c;
|
return (unsigned char)c;
|
||||||
}
|
}
|
||||||
|
|
||||||
int ungetc(int c, FILE* stream)
|
|
||||||
{
|
|
||||||
ScopeLock _(stream);
|
|
||||||
return ungetc_unlocked(c, stream);
|
|
||||||
}
|
|
||||||
|
|
||||||
int vfprintf(FILE* file, const char* format, va_list arguments)
|
int vfprintf(FILE* file, const char* format, va_list arguments)
|
||||||
{
|
{
|
||||||
ScopeLock _(file);
|
ScopeLock _(file);
|
||||||
|
@ -820,18 +815,7 @@ int vfprintf(FILE* file, const char* format, va_list arguments)
|
||||||
int vfscanf(FILE* file, const char* format, va_list arguments)
|
int vfscanf(FILE* file, const char* format, va_list arguments)
|
||||||
{
|
{
|
||||||
ScopeLock _(file);
|
ScopeLock _(file);
|
||||||
return scanf_impl(format, arguments,
|
return scanf_impl(format, arguments, [](void* file) { return getc_unlocked(static_cast<FILE*>(file)); }, file);
|
||||||
[](bool advance, void* data)
|
|
||||||
{
|
|
||||||
FILE* fp = static_cast<FILE*>(data);
|
|
||||||
|
|
||||||
if (advance)
|
|
||||||
getc_unlocked(fp);
|
|
||||||
const int ret = getc_unlocked(fp);
|
|
||||||
ungetc_unlocked(ret, fp);
|
|
||||||
return ret;
|
|
||||||
}, file
|
|
||||||
);
|
|
||||||
}
|
}
|
||||||
|
|
||||||
int vprintf(const char* format, va_list arguments)
|
int vprintf(const char* format, va_list arguments)
|
||||||
|
@ -899,15 +883,12 @@ int vsprintf(char* buffer, const char* format, va_list arguments)
|
||||||
int vsscanf(const char* s, const char* format, va_list arguments)
|
int vsscanf(const char* s, const char* format, va_list arguments)
|
||||||
{
|
{
|
||||||
return scanf_impl(format, arguments,
|
return scanf_impl(format, arguments,
|
||||||
[](bool advance, void* data) -> int
|
[](void* data) -> int
|
||||||
{
|
{
|
||||||
const char** ptr = static_cast<const char**>(data);
|
char ret = **static_cast<char**>(data);
|
||||||
|
(*static_cast<char**>(data))++;
|
||||||
if (advance)
|
|
||||||
(*ptr)++;
|
|
||||||
const char ret = **ptr;
|
|
||||||
if (ret == '\0')
|
if (ret == '\0')
|
||||||
return EOF;
|
return -1;
|
||||||
return ret;
|
return ret;
|
||||||
}, &s
|
}, &s
|
||||||
);
|
);
|
||||||
|
|
|
@ -162,6 +162,7 @@ static T strtoT(const char* str, char** endp, int base, int& error)
|
||||||
return result;
|
return result;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
template<BAN::floating_point T>
|
template<BAN::floating_point T>
|
||||||
static T strtoT(const char* str, char** endp, int& error)
|
static T strtoT(const char* str, char** endp, int& error)
|
||||||
{
|
{
|
||||||
|
@ -305,13 +306,16 @@ static T strtoT(const char* str, char** endp, int& error)
|
||||||
|
|
||||||
if (exponent)
|
if (exponent)
|
||||||
result *= BAN::Math::pow<T>((base == 10) ? 10 : 2, exponent);
|
result *= BAN::Math::pow<T>((base == 10) ? 10 : 2, exponent);
|
||||||
return negative ? -result : result;
|
return result;
|
||||||
}
|
}
|
||||||
|
#endif
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
double atof(const char* str)
|
double atof(const char* str)
|
||||||
{
|
{
|
||||||
return strtod(str, nullptr);
|
return strtod(str, nullptr);
|
||||||
}
|
}
|
||||||
|
#endif
|
||||||
|
|
||||||
int atoi(const char* str)
|
int atoi(const char* str)
|
||||||
{
|
{
|
||||||
|
@ -328,6 +332,7 @@ long long atoll(const char* str)
|
||||||
return strtoll(str, nullptr, 10);
|
return strtoll(str, nullptr, 10);
|
||||||
}
|
}
|
||||||
|
|
||||||
|
#if __enable_sse
|
||||||
float strtof(const char* __restrict str, char** __restrict endp)
|
float strtof(const char* __restrict str, char** __restrict endp)
|
||||||
{
|
{
|
||||||
return strtoT<float>(str, endp, errno);
|
return strtoT<float>(str, endp, errno);
|
||||||
|
@ -342,6 +347,7 @@ long double strtold(const char* __restrict str, char** __restrict endp)
|
||||||
{
|
{
|
||||||
return strtoT<long double>(str, endp, errno);
|
return strtoT<long double>(str, endp, errno);
|
||||||
}
|
}
|
||||||
|
#endif
|
||||||
|
|
||||||
long strtol(const char* __restrict str, char** __restrict endp, int base)
|
long strtol(const char* __restrict str, char** __restrict endp, int base)
|
||||||
{
|
{
|
||||||
|
|
|
@ -6,6 +6,7 @@
|
||||||
#include <LibImage/PNG.h>
|
#include <LibImage/PNG.h>
|
||||||
|
|
||||||
#include <fcntl.h>
|
#include <fcntl.h>
|
||||||
|
#include <math.h>
|
||||||
#include <sys/mman.h>
|
#include <sys/mman.h>
|
||||||
|
|
||||||
namespace LibImage
|
namespace LibImage
|
||||||
|
@ -131,8 +132,13 @@ namespace LibImage
|
||||||
{
|
{
|
||||||
const double src_x = x * ratio_x;
|
const double src_x = x * ratio_x;
|
||||||
const double src_y = y * ratio_y;
|
const double src_y = y * ratio_y;
|
||||||
const double weight_x = src_x - BAN::Math::floor(src_x);
|
#if __enable_sse
|
||||||
const double weight_y = src_y - BAN::Math::floor(src_y);
|
const double weight_x = src_x - floor(src_x);
|
||||||
|
const double weight_y = src_y - floor(src_y);
|
||||||
|
#else
|
||||||
|
const double weight_x = src_x - (uint64_t)src_x;
|
||||||
|
const double weight_y = src_y - (uint64_t)src_y;
|
||||||
|
#endif
|
||||||
|
|
||||||
const Color avg_t = Color::average(
|
const Color avg_t = Color::average(
|
||||||
get_clamped_color(src_x + 0.0, src_y),
|
get_clamped_color(src_x + 0.0, src_y),
|
||||||
|
@ -171,8 +177,13 @@ namespace LibImage
|
||||||
{
|
{
|
||||||
const double src_x = x * ratio_x;
|
const double src_x = x * ratio_x;
|
||||||
const double src_y = y * ratio_y;
|
const double src_y = y * ratio_y;
|
||||||
const double weight_x = src_x - BAN::Math::floor(src_x);
|
#if __enable_sse
|
||||||
const double weight_y = src_y - BAN::Math::floor(src_y);
|
const double weight_x = src_x - floor(src_x);
|
||||||
|
const double weight_y = src_y - floor(src_y);
|
||||||
|
#else
|
||||||
|
const double weight_x = src_x - (uint64_t)src_x;
|
||||||
|
const double weight_y = src_y - (uint64_t)src_y;
|
||||||
|
#endif
|
||||||
|
|
||||||
FloatingColor values[4];
|
FloatingColor values[4];
|
||||||
for (int64_t m = -1; m <= 2; m++)
|
for (int64_t m = -1; m <= 2; m++)
|
||||||
|
|
|
@ -46,4 +46,9 @@ foreach(project ${USERSPACE_PROGRAMS})
|
||||||
target_link_options(${project} PRIVATE -nolibc)
|
target_link_options(${project} PRIVATE -nolibc)
|
||||||
# Default compile options
|
# Default compile options
|
||||||
target_compile_options(${project} PRIVATE -g -O2 -Wall -Wextra -Werror)
|
target_compile_options(${project} PRIVATE -g -O2 -Wall -Wextra -Werror)
|
||||||
|
|
||||||
|
target_compile_definitions(${project} PRIVATE __enable_sse=${BANAN_ENABLE_SSE})
|
||||||
|
if (NOT BANAN_ENABLE_SSE)
|
||||||
|
target_compile_options(${project} PRIVATE -mno-sse -mno-sse2)
|
||||||
|
endif ()
|
||||||
endforeach()
|
endforeach()
|
||||||
|
|
|
@ -19,15 +19,12 @@ int main()
|
||||||
attributes.alpha_channel = false;
|
attributes.alpha_channel = false;
|
||||||
attributes.rounded_corners = false;
|
attributes.rounded_corners = false;
|
||||||
window->set_attributes(attributes);
|
window->set_attributes(attributes);
|
||||||
window->set_close_window_event_callback([]() {});
|
|
||||||
|
|
||||||
window->set_position(0, 0);
|
window->set_position(0, 0);
|
||||||
|
|
||||||
window->fill(bg_color);
|
window->fill(bg_color);
|
||||||
window->invalidate();
|
window->invalidate();
|
||||||
|
|
||||||
bool is_running = true;
|
|
||||||
|
|
||||||
time_t last_update;
|
time_t last_update;
|
||||||
const auto update_time_string =
|
const auto update_time_string =
|
||||||
[&]()
|
[&]()
|
||||||
|
@ -43,11 +40,10 @@ int main()
|
||||||
|
|
||||||
window->fill_rect(text_x, text_y, text_w, text_h, bg_color);
|
window->fill_rect(text_x, text_y, text_w, text_h, bg_color);
|
||||||
window->draw_text(time_sv, font, text_x, text_y, fg_color);
|
window->draw_text(time_sv, font, text_x, text_y, fg_color);
|
||||||
if (!window->invalidate(text_x, text_y, text_w, text_h))
|
window->invalidate(text_x, text_y, text_w, text_h);
|
||||||
is_running = false;
|
|
||||||
};
|
};
|
||||||
|
|
||||||
while (is_running)
|
for (;;)
|
||||||
{
|
{
|
||||||
update_time_string();
|
update_time_string();
|
||||||
|
|
||||||
|
|
|
@ -224,11 +224,8 @@ void WindowServer::on_key_event(LibInput::KeyEvent event)
|
||||||
// Kill window with mod+Q
|
// Kill window with mod+Q
|
||||||
if (m_is_mod_key_held && event.pressed() && event.key == LibInput::Key::Q)
|
if (m_is_mod_key_held && event.pressed() && event.key == LibInput::Key::Q)
|
||||||
{
|
{
|
||||||
if (!m_focused_window)
|
if (m_focused_window)
|
||||||
return;
|
remove_client_fd(m_focused_window->client_fd());
|
||||||
LibGUI::EventPacket::CloseWindowEvent packet;
|
|
||||||
if (auto ret = packet.send_serialized(m_focused_window->client_fd()); ret.is_error())
|
|
||||||
dwarnln("could not send window close event: {}", ret.error());
|
|
||||||
return;
|
return;
|
||||||
}
|
}
|
||||||
|
|
||||||
|
|
|
@ -21,4 +21,9 @@ foreach(project ${USERSPACE_TESTS})
|
||||||
target_link_options(${project} PRIVATE -nolibc)
|
target_link_options(${project} PRIVATE -nolibc)
|
||||||
# Default compile options
|
# Default compile options
|
||||||
target_compile_options(${project} PRIVATE -g -O2)
|
target_compile_options(${project} PRIVATE -g -O2)
|
||||||
|
|
||||||
|
target_compile_definitions(${project} PRIVATE __enable_sse=${BANAN_ENABLE_SSE})
|
||||||
|
if (NOT BANAN_ENABLE_SSE)
|
||||||
|
target_compile_options(${project} PRIVATE -mno-sse -mno-sse2)
|
||||||
|
endif ()
|
||||||
endforeach()
|
endforeach()
|
||||||
|
|
Loading…
Reference in New Issue